程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 314
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 220
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 153
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 270
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
Local-File-Organizer 深度解析:3K Stars 本地 AI 文件整理,Llama3.2+LLaVA 完全离线运行
编程
Local-File-Organizer 深度解析:3K Stars 本地 AI 文件整理,Llama3.2+LLaVA 完全离线运行
2026-05-15 12:22:33 +0800 CST
view 274
深入解析 3K Stars 的 Local-File-Organizer:基于 Llama3.2 3B + LLaVA-v1.6 双模型的本地 AI 文件整理工具,使用 Nexa SDK 实现 100% 离线推理,自动识别文件内容、智能分类重命名、支持图片视觉分析和文档内容解析,零数据外泄。
Local-File-Organizer
AI文件整理
Llama3
LLaVA
本地AI
隐私
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 172
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 1534
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
Nushell 深度解析:为什么 2026 年最值得学习的 Shell 不是 Bash
编程
Nushell 深度解析:为什么 2026 年最值得学习的 Shell 不是 Bash
2026-04-18 00:47:07 +0800 CST
view 421
深入解析 2026 年最值得学习的 Shell 工具 Nushell,从架构设计、管道机制、代码实战多维度剖析,探讨它如何用结构化数据管道取代传统文本流,以及如何在生产环境中落地使用。
Nushell
Rust
Shell
命令行
Linux
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 253
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
编程
分布式 LLM 推理架构深度实战:从 vLLM 单节点到 llm-d 多集群的生产级演进全链路解析
2026-05-09 03:39:58 +0800 CST
view 463
深度解析分布式 LLM 推理架构,从 vLLM 单节点到 llm-d 多集群的生产级演进。涵盖推理引擎层、编排调度层、Kubernetes 多机多卡部署实战、性能优化技巧及成本优化策略。
LLM
vLLM
分布式推理
Kubernetes
Ray
推理引擎
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 784
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
编程
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
2026-04-28 14:24:36 +0800 CST
view 347
深度解析 Pgrx(4.5k+ Stars)框架:用 Rust 为 PostgreSQL 编写高性能扩展,涵盖类型映射、内存管理、代码实战与生产部署完整指南。
Rust
PostgreSQL
数据库扩展
高性能
开源
系统编程
Pgrx
AI Agent的「万能硬盘」来了!Mirage让AI用Bash一招打天下
案例
AI Agent的「万能硬盘」来了!Mirage让AI用Bash一招打天下
2026-05-09 07:14:45 +0800 CST
view 478
Mirage开源工具:把S3/Slack/GitHub/MongoDB等所有数据源映射成统一文件系统,让AI Agent用Bash命令操作一切。零API学习,两层缓存快照,一行代码接入主流框架
AI Agent
文件系统抽象
Bash工具
数据源统一
Mirage
零API学习
OpenAI Agents SDK
Hermes Agent 深度实战:自我进化的 AI Agent 架构与生产级实践——从 NousResearch 15万星项目中看 AI 编程伙伴的新范式
编程
Hermes Agent 深度实战:自我进化的 AI Agent 架构与生产级实践——从 NousResearch 15万星项目中看 AI 编程伙伴的新范式
2026-05-22 13:17:11 +0800 CST
view 414
深入解析 NousResearch 开源的 Hermes Agent(15.5万星)六层架构、三层记忆系统、Skills 七阶段进化闭环,包含完整源码解析和 8 种部署方案对比
AI Agent
Hermes Agent
NousResearch
自我进化
记忆系统
MemPalace 深度实战:当 AI Agent 遇见「记忆宫殿」——从本地优先架构到 96.6% 召回率的生产级完全指南(2026)
编程
MemPalace 深度实战:当 AI Agent 遇见「记忆宫殿」——从本地优先架构到 96.6% 召回率的生产级完全指南(2026)
2026-06-16 03:46:31 +0800 CST
view 113
MemPalace 深度实战:本地优先的 AI 记忆系统,96.6% R@5 召回率,33 个 MCP 工具,零 API Key,完全开源
AI Agent
记忆系统
MemPalace
本地优先
RAG
编程
使用 Go 构建一个简单的负载均衡器
2024-11-19 06:02:08 +0800 CST
view 1728
本文介绍了如何使用Go语言实现一个简单的轮询负载均衡器。负载均衡器通过将流量分配到多个服务器,确保系统的高可用性和可扩展性。文章详细讲解了负载均衡器的结构、轮询算法的实现、健康检查机制以及请求处理的代码示例,帮助读者理解负载均衡器的工作原理。
软件开发
网络编程
系统架构
Zig语言0.16.0深度解析:当「无隐藏魔法」遇上AI时代——从反投机哲学到未来50年的系统编程宣言
编程
Zig语言0.16.0深度解析:当「无隐藏魔法」遇上AI时代——从反投机哲学到未来50年的系统编程宣言
2026-06-10 09:50:08 +0800 CST
view 210
深度解析Zig语言0.16.0版本的重大更新,探讨Zig拒绝AI代码的设计哲学,以及comptime、显式错误处理等核心特性的实战应用。
Zig语言
系统编程
编程语言
0.16.0
AI编程
内存安全
comptime
综合
中后台开发神器!Cool-Admin-Midway 让你一分钟完成后台搭建!
2024-11-18 01:31:19 +0800 CST
view 2231
Cool-Admin-Midway是基于Midway.js的后台管理系统解决方案,旨在帮助开发者快速搭建企业级管理系统。它结合了Midway.js的强大架构和Cool-Admin的高效前端模板,支持用户管理、权限控制等功能,适用于电商和SaaS平台。该系统具有模块化设计、AI编码、跨平台兼容性等特点,能够满足复杂的业务需求。
后台开发
企业级应用
技术框架
管理系统
开发工具
从零构建技术基础设施:build-your-own-x 49万星背后的编程教育革命
编程
从零构建技术基础设施:build-your-own-x 49万星背后的编程教育革命
2026-05-22 14:14:54 +0800 CST
view 308
深入剖析 GitHub 49万星项目 build-your-own-x,讲解从零实现 Redis、Docker、Git 等核心技术的方法论与实践
build-your-own-x
编程教育
系统思维
从零实现
Agent-Memory 深度解析:当 AI Agent 终于学会「从错误中进化」
编程
Agent-Memory 深度解析:当 AI Agent 终于学会「从错误中进化」
2026-04-09 07:13:25 +0800 CST
view 540
Agent-Memory是一个开源的自进化记忆治理系统,旨在解决传统AIAgent的“会话即遗忘”问题,使其能够从经验中主动学习并改进行为策略。系统通过五层核心组件(事件层、策略层、决策层、治理层、主机内存发布层)实现学习闭环,强调记忆与学习的本质区别,并与GitNexus、MemPalace形成“执行→记忆→进化”的完整能力图谱。项目支持优雅降级和容量护栏设计,适用于长期运行的自动化Agent,推动AI从工具向伙伴进化。
人工智能
开源项目
机器学习
自动化系统
软件架构
造轮子才是正道:build-your-own-x 与编程教育的底层逻辑
编程
造轮子才是正道:build-your-own-x 与编程教育的底层逻辑
2026-05-22 14:15:31 +0800 CST
view 284
深入剖析 GitHub 49万星项目 build-your-own-x,讲解从零实现 Redis、Docker、Git 等核心技术的方法论
build-your-own-x
编程教育
系统思维
从零实现
MentraOS深度解析:开源智能眼镜操作系统的技术架构与生态革命
编程
MentraOS深度解析:开源智能眼镜操作系统的技术架构与生态革命
2026-04-18 18:45:54 +0800 CST
view 499
深度解析MentraOS开源智能眼镜操作系统的技术架构、跨平台兼容性实现、传感器数据处理、应用开发实战,以及对智能眼镜生态战略的分析与展望。
智能眼镜
开源
操作系统
AR
TypeScript
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
编程
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
2026-06-10 11:17:06 +0800 CST
view 196
2026年6月1日英伟达发布Vera Rubin AI系统,专为Agent时代打造。本文深度解析Vera CPU全球首款AI Agent专用处理器、Rubin GPU动态稀疏注意力、NVLink 72片间互联、RTX Spark进军PC市场、Isaac GROOT人形机器人平台等核心技术,从程序员视角全面剖析这场计算架构革命。
NVIDIA
Vera Rubin
Agent AI
GTC 2026
AI系统
Isaac GROOT
RTX Spark
Nemotron
深度解析
告别客服工单系统,10倍加速的AI原生客服平台开源了
编程
告别客服工单系统,10倍加速的AI原生客服平台开源了
2026-04-18 19:05:02 +0800 CST
view 442
微语ByteDesk开源智能客服系统,企业级AI工作平台,支持私有部署,工单管理
开源
AI
客服系统
工具
字节跳动
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
7
8
9
10
11
...
30
下一页