程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
编程
Karpathy的LLM Wiki:一种将RAG从「解释器模式」升级为「编译器模式」的革命性架构
2026-04-19 09:13:12 +0800 CST
view 1515
深度解析Karpathy提出的LLM Wiki架构,从算法原理、工程实现、代码实战三个维度讲清楚「编译器模式」如何颠覆传统RAG知识库
LLM Wiki
RAG
知识库
AI Agent
Karpathy
自进化知识库
第二大脑
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
编程
Headroom 深度实战:当 AI Agent 遇见上下文压缩——从 Token 黑洞到 60-95% 暴降的生产级完全指南(2026)
2026-06-16 13:16:31 +0800 CST
view 300
Headroom 是一个 GitHub 上 26000+ Star 的开源项目,作为 AI Agent 的上下文压缩中间层,实测节省 60-95% Token,精度保留率 97%。本文从架构设计、六大压缩算法、CCR 可逆压缩、跨 Agent 记忆等维度深度拆解。
AI Agent
Headroom
Token优化
上下文压缩
LLM
开源项目
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
编程
vLLM 2026 推理引擎全解:从 PagedAttention 到分离式 Prefill,如何把大模型跑出 GPU 极限性能
2026-06-29 17:16:04 +0800 CST
view 118
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
编程
万字长文拆解 vLLM 0.18:PagedAttention 如何用操作系统思维颠覆大模型推理
2026-06-29 17:17:00 +0800 CST
view 94
2026年vLLM 0.18深度解析:PagedAttention显存管理、EAGLE3推测解码、连续批处理、分离式Prefill、FP4量化,附生产级部署代码与Benchmark对比
vLLM
LLM推理
PagedAttention
推测解码
EAGLE3
FP4量化
CUDA
GPU性能优化
Shannon 深度解析:当 AI Agent 把渗透测试变成一场「无人驾驶」
编程
Shannon 深度解析:当 AI Agent 把渗透测试变成一场「无人驾驶」
2026-04-10 02:55:17 +0800 CST
view 963
当 AI Agent 把渗透测试变成一场「无人驾驶」:深度解析 KeygraphHQ 开源的 Shannon 项目,16k Stars,XBOW 基准 96.15% 成功率,四阶段 Agent 流水线实现零误报渗透测试。
AI安全
渗透测试
Agent
自动化安全
网络安全
Hermes Agent 深度实战:当 AI Agent 学会「自我进化」——从三层记忆架构到技能自学习系统的生产级完全指南(2026)
编程
Hermes Agent 深度实战:当 AI Agent 学会「自我进化」——从三层记忆架构到技能自学习系统的生产级完全指南(2026)
2026-06-10 20:51:21 +0800 CST
view 199
深入解析 Hermes Agent 的核心设计哲学、三层记忆架构、技能自学习系统,以及如何构建具备自我进化能力的生产级 AI Agent。
AI Agent
Python
开源项目
机器学习
自动化
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
编程
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(上)
2026-05-16 14:59:36 +0800 CST
view 346
深度剖析2026年长时程Agent技术革命(上篇):从任务分解、长期记忆、自我反思三大核心能力,到LangGraph代码实战。
AI Agent
长时程任务
LLM
AGI
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(下)
编程
长时程Agent革命:2026年AI从"聊天机器人"到"自主工作者"的终极跨越(下)
2026-05-16 15:00:00 +0800 CST
view 402
深度剖析2026年长时程Agent技术革命(下篇):工业最佳实践、性能优化策略、未来展望,全面解读AI如何从聊天机器人进化成自主工作者。
AI Agent
多智能体协作
性能优化
未来展望
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
编程
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
2026-06-10 22:16:42 +0800 CST
view 500
Headroom上下文压缩中间层实战:Token节省60-95%,精度保留97%。从原理拆解到LangChain/OpenClaw生产级集成,附完整代码示例。
AI Agent
上下文压缩
Token优化
Headroom
LLM成本
LangChain
RAG
生产级实战
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 397
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
Qdrant 2026 深度实战:当 Rust 遇上向量数据库——从 HNSW 算法到亿级向量检索、从内存优化到生产级 RAG 管道的完全指南
编程
Qdrant 2026 深度实战:当 Rust 遇上向量数据库——从 HNSW 算法到亿级向量检索、从内存优化到生产级 RAG 管道的完全指南
2026-06-22 05:29:50 +0800 CST
view 152
Qdrant 2026 深度实战指南,从 HNSW 算法原理到 Rust 存储引擎剖析,从生产级部署到 RAG 管道构建,15000 字完整教程。
Qdrant
向量数据库
Rust
AI
RAG
HNSW
Linux 7.1/7.2 内核深度实战:当 NTFS 获得"重生"——从 iomap 延迟分配到 folio 内存管理、从 FRED 事件分发到三行代码撬动 5% IOPS 的存储性能革命(2026)
编程
Linux 7.1/7.2 内核深度实战:当 NTFS 获得"重生"——从 iomap 延迟分配到 folio 内存管理、从 FRED 事件分发到三行代码撬动 5% IOPS 的存储性能革命(2026)
2026-06-22 06:32:06 +0800 CST
view 161
Linux 7.1 NTFS驱动重生:iomap+folio+延迟分配实现35%-110%性能提升;FRED事件分发减少中断开销;Linux 7.2两行代码优化带来5%IOPS提升的深度技术解析
Linux
内核
NTFS
iomap
folio
FRED
存储
性能优化
DeepTutor 深度解析:当 AI 教育从「问答工具」进化为「原生智能体导师」
编程
DeepTutor 深度解析:当 AI 教育从「问答工具」进化为「原生智能体导师」
2026-04-10 05:13:09 +0800 CST
view 1327
香港大学数据科学研究所开源的 DeepTutor v1.0.0,标志教育AI进入Agent-Native时代:持久记忆、主动教学、多实例TutorBot、CLI原生,从问答工具进化为智能体导师生态系统。
AI
教育
Agent
DeepTutor
HKUDS
开源
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
编程
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
2026-05-23 03:16:51 +0800 CST
view 330
2026 年最新 RAG 生产级工程化完全指南,从 Naive RAG 到 Agentic RAG 的架构演进,11 个性能优化策略,准确率从 60% 到 94%。
RAG
检索增强生成
生产级工程化
LangChain
Agentic RAG
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
编程
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
2026-05-23 03:46:21 +0800 CST
view 376
深度解析 Trae SOLO 模式的架构设计与生产级实践,从 Chat 到 SOLO 的三层演进、主 Agent + 子 Agent 协同机制、MCP 接入、多模型编排、性能优化技巧、CI/CD 集成等实战内容,附带完整项目演练。
Trae
SOLO模式
AI编程
字节跳动
Agent
自主开发
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
编程
Andrej Karpathy 的 CLAUDE.md 工程规范深度解析:AI 辅助编码的四大原则与生产级实践
2026-06-30 00:42:36 +0800 CST
view 58
深度解析 Andrej Karpathy 的 CLAUDE.md 四大原则:先思考后编码、简洁优先、精准修改、目标驱动,附带完整代码实战与生产级落地方案。
Andrej Karpathy
CLAUDE.md
AI辅助编码
提示词工程
LLM
AI Agent
系统提示
Python
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
编程
Rowboat 深度解析:当 AI 同事第一次拥有「长期记忆」,工作变成可积累的知识图谱
2026-04-10 05:35:25 +0800 CST
view 575
Rowboat 是一个带长期记忆的开源 AI 同事,自动构建知识图谱,支持会议准备、文档生成、承诺追踪,采用本地优先架构,完全透明可控。
AI Agent
知识图谱
开源工具
本地优先
生产力工具
从Token内卷到DAA崛起:百度Create2026重新定义AI价值度量衡
编程
从Token内卷到DAA崛起:百度Create2026重新定义AI价值度量衡
2026-05-16 17:21:12 +0800 CST
view 393
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
李彦宏抛出DAA背后的AI大变局:百度搭子秒哒伐谋三箭齐发
编程
李彦宏抛出DAA背后的AI大变局:百度搭子秒哒伐谋三箭齐发
2026-05-16 17:22:10 +0800 CST
view 410
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
Warp 终端开源深度实战:从 Rust 渲染引擎到 AI Agent 开发环境的架构全解析
编程
Warp 终端开源深度实战:从 Rust 渲染引擎到 AI Agent 开发环境的架构全解析
2026-06-02 14:57:15 +0800 CST
view 241
深度解析 Warp 终端开源架构:Rust + GPU 渲染引擎、Block 交互范式、Oz Agent 编排引擎、Skill 开发体系,从源码编译到自定义 Skill 开发的完整实战指南
Rust
终端
AI Agent
开源
Warp
JetBrains Koog 深度解析:JVM 原生 AI Agent 框架如何让 Java 程序员在 AI 时代扬眉吐气
编程
JetBrains Koog 深度解析:JVM 原生 AI Agent 框架如何让 Java 程序员在 AI 时代扬眉吐气
2026-05-10 10:54:07 +0800 CST
view 402
JetBrains Koog 是专为 Java/Kotlin 开发者设计的 JVM 原生 AI Agent 框架,支持 Spring Boot 深度集成、类型安全输出、多平台部署(KMP)。本文深入解析其架构设计与实战用法。
Koog
JetBrains
AI Agent
JVM
Kotlin
Spring Boot
框架
告别Token崇拜:Create2026揭示AI时代从流量思维到价值思维的根本跃迁
编程
告别Token崇拜:Create2026揭示AI时代从流量思维到价值思维的根本跃迁
2026-05-16 17:23:01 +0800 CST
view 378
2026年5月百度Create2026大会,李彦宏首提DAA(日活智能体数)作为AI时代度量衡。本文深度解析这一概念的战略意义,以及百度DuMate、秒哒、伐谋等Agent产品的技术架构。
百度
DAA
AI Agent
Create2026
DuMate
秒哒
伐谋
智能体
AI时代度量衡
超级个体
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 251
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
编程
你睡觉,AI 干活:Karpathy 的 AutoResearch 如何让大模型自己学会训练自己
2026-04-19 18:47:36 +0800 CST
view 641
深入解析 Andrej Karpathy 的 AutoResearch 开源项目,揭示其让 AI agent 自主修改训练代码、在真实执行中验证改进的核心机制,探讨对算法工程师职业的影响。
AI研究
机器学习
AutoML
LLM训练
Andrej Karpathy
GitHub开源
自动化调参
Python
研究效率
Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
56
57
58
59
60
...
71
下一页