程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 125
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
OpenAI Codex 2026 深度实战:从 CLI 到手机遥控——AI 编程 Agent 的全栈进化完全指南
编程
OpenAI Codex 2026 深度实战:从 CLI 到手机遥控——AI 编程 Agent 的全栈进化完全指南
2026-05-29 06:37:51 +0800 CST
view 495
2026年5月OpenAI Codex密集更新全面解析
AI编程
OpenAI
Codex
GPT-5
CLI
自动化
Agent
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 86
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 400
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
Mano-P + Cider:4B模型本地操控Mac,端侧GUI Agent新时代
案例
Mano-P + Cider:4B模型本地操控Mac,端侧GUI Agent新时代
2026-05-07 13:34:32 +0800 CST
view 277
明略科技开源Mano-P(4B量化模型本地操控Mac)和Cider(MLX推理加速框架)。476 tokens/s预填充,76 tokens/s解码,峰值内存4.3GB,完全本地运行数据不出设备,离线长任务自主规划
GUI Agent
端侧AI
Apple Silicon
MLX
视觉理解
本地运行
Mano-P
Cider
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
编程
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
2026-06-08 23:26:28 +0800 CST
view 103
AI-Scientist-v2是Sakana AI联合牛津大学等机构开发的自动化科研系统,能从零生成科研创意、执行实验并撰写论文。本文深入剖析其树搜索算法、并行代理架构和GPU调度策略,探讨AI对科研生态的影响。
AI-Scientist-v2
树搜索
自动化科研
AI编程
Sakana AI
并行代理
GPU调度
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
编程
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
2026-06-15 00:18:14 +0800 CST
view 67
深度剖析 Redis 之父 antirez 的最新项目 ds4 (DwarfStar),专为 DeepSeek V4 Flash 设计的本地推理引擎。涵盖非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 优化、内置 Coding Agent 等核心技术。
ds4
DwarfStar
antirez
Redis
大模型推理
MoE架构
量化
Claude-Mem 深度实战:56K+ Star 的 Claude Code 持久记忆插件——从 Hook 生命周期架构到渐进式检索的全链路解析
编程
Claude-Mem 深度实战:56K+ Star 的 Claude Code 持久记忆插件——从 Hook 生命周期架构到渐进式检索的全链路解析
2026-05-07 14:38:24 +0800 CST
view 308
深度解析 Claude-Mem 的 Hook 生命周期架构、异步队列处理、AI 压缩、FTS5 全文搜索和渐进式披露检索机制,附完整代码实战
Claude Code
AI Agent
持久记忆
Hook
FTS5
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
编程
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
2026-06-15 00:50:09 +0800 CST
view 107
Agent Skills 是 Google 工程总监 Addy Osmani 开源的 AI 编程工程技能库,通过 7 个斜杠命令(/spec、/plan、/build、/test、/review、/code-simplify、/ship)将软件开发六阶段生命周期固化到 AI 工作流中,让 AI 从「代码生成器」升级为「工程助手」。
AI编程
Agent Skills
Addy Osmani
Claude Code
工程化
软件开发
Skill
生产级
DeerFlow 2.0 深度解析:字节跳动开源的智能体时代操作系统
编程
DeerFlow 2.0 深度解析:字节跳动开源的智能体时代操作系统
2026-04-17 05:39:08 +0800 CST
view 644
DeerFlow 2.0 是字节跳动开源的 Super Agent 运行时基础设施,登顶 GitHub Trending 榜首。本文深度解析其架构设计、核心原理、实战部署与性能优化。
DeerFlow
AI Agent
字节跳动
LangGraph
MCP
开源项目
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
编程
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
2026-04-26 13:13:17 +0800 CST
view 498
深度解析字节跳动开源DeerFlow 2.0超级智能体执行底座:63K Star背后的架构设计哲学,从LangGraph编排引擎、渐进式技能加载、隔离式子智能体到Docker/K8s沙箱安全隔离,含完整代码实战与生产部署指南
DeerFlow
AI Agent
字节跳动
LangGraph
超级智能体
沙箱
多智能体编排
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
2026-06-15 01:18:03 +0800 CST
view 88
2026年6月英伟达发布全球首款全模态物理AI世界模型Cosmos 3。本文从MoT混合架构、代码实战、Agent Skills工作流、性能分析、生产部署五个维度,带你彻底搞懂这个被业界定义为物理AI产业「安卓时刻」的技术突破。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
机器人
自动驾驶
深度学习
AI Agent
仿真
OpenAI Codex CLI 深度实战:当 Rust 遇上 AI Agent——从终端原生架构到生产级代码助手的完全指南(2026)
编程
OpenAI Codex CLI 深度实战:当 Rust 遇上 AI Agent——从终端原生架构到生产级代码助手的完全指南(2026)
2026-06-09 00:53:08 +0800 CST
view 90
2026年 OpenAI Codex CLI 完全指南:从 Rust 架构原理、操作系统级沙箱(Landlock/Seatbelt)、AGENTS.md 项目指令、MCP 工具集成,到移动端远程操控、Sites 部署、Annotations 精细修改的全方位实战。适合所有水平的开发者深入学习 AI 编程助手的生产级应用。
OpenAI
Codex CLI
Rust
AI编程
终端工具
AI Agent
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
编程
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
2026-06-15 01:49:57 +0800 CST
view 49
深度解析 GitHub Trending 2026 榜首项目 Headroom,详解如何让 LLM Token 消耗减少 60-95% 而回答质量不降,含完整代码示例与生产成本优化方案。
LLM
Token压缩
AI Agent
上下文工程
Headroom
Python
Rust
成本优化
Warp 深度实战:49K+ Star 的 AI Agent 原生终端——从 Block 架构到 Oz 云代理平台的全链路解析
编程
Warp 深度实战:49K+ Star 的 AI Agent 原生终端——从 Block 架构到 Oz 云代理平台的全链路解析
2026-05-07 21:38:59 +0800 CST
view 305
深入剖析 Warp 终端的开源架构,从 Block-Based 输出模型到 GPU 加速渲染,从 AI Agent 原生集成到 Oz 云代理平台,全面解读 49K+ Star 背后的技术革新。
Warp
终端
Rust
AI Agent
GPU渲染
MCP
Skills
OpenViking:给 AI Agent 装上跨会话、跨平台的长期记忆
编程
OpenViking:给 AI Agent 装上跨会话、跨平台的长期记忆
2026-06-09 07:47:48 +0800 CST
view 101
OpenViking 是火山引擎开源的 Agent 记忆中枢,通过 MCP 接入 Trae、Codex、Claude Code 等工具,实现设计规范的自动提取、精准召回和跨平台共享。
AI Agent
MCP
长期记忆
前端开发
Paperclip深度解析:59K Star的「AI企业操作系统」,让AI自主组建、运营一整家公司
编程
Paperclip深度解析:59K Star的「AI企业操作系统」,让AI自主组建、运营一整家公司
2026-04-26 21:11:45 +0800 CST
view 369
Paperclip是2026年崛起的开源项目,GitHub 59K Stars,MIT协议,被称为AI企业操作系统。它用12大子系统(身份认证、组织架构、工单、预算硬停、治理审批、心跳调度等)让AI Agent自主组建、运营完整公司。
AI
开源
Agent
Paperclip
自动化
管理工具
Apache Flink 2.0 深度解析:9 年磨一剑的实时数据革命,从 API 大清洗到存算分离
编程
Apache Flink 2.0 深度解析:9 年磨一剑的实时数据革命,从 API 大清洗到存算分离
2026-05-15 06:14:26 +0800 CST
view 312
Flink 2.0是9年来首次大版本更新,核心API大清洗、存算分离状态管理、物化表、批作业自适应执行、Flink Agents流式AI Agent,完整迁移实战与性能基准测试。
Flink
流处理
存算分离
实时数据
Flink Agents
Zed 1.0 深度实战:Rust 重写的代码编辑器为何被称为 VS Code 终结者——从 GPUI 架构到 AI Agent 全栈指南(2026)
编程
Zed 1.0 深度实战:Rust 重写的代码编辑器为何被称为 VS Code 终结者——从 GPUI 架构到 AI Agent 全栈指南(2026)
2026-05-30 10:38:50 +0800 CST
view 396
Zed 1.0 深度实战,从 GPUI 架构原理到 AI Agent 原生集成,全面解析 Rust 重写的代码编辑器
Zed
Rust
VS Code
GPUI
代码编辑器
AI Agent
字节跳动DeerFlow 2.0:当AI Agent从'会说话'进化到'能做事'
编程
字节跳动DeerFlow 2.0:当AI Agent从'会说话'进化到'能做事'
2026-04-08 10:38:43 +0800 CST
view 620
深度解析字节跳动开源的DeerFlow 2.0,57k Star的超级智能体运行时框架,四大核心模块解决AI Agent痛点,从对话工具进化为执行系统。
AI
Agent
开源
字节跳动
技术趋势
GPT-5-Codex 深度解析:从「代码补全」到「7 小时自主编程」,OpenAI 如何重新定义 AI 编程智能体
编程
GPT-5-Codex 深度解析:从「代码补全」到「7 小时自主编程」,OpenAI 如何重新定义 AI 编程智能体
2026-05-15 07:13:11 +0800 CST
view 616
GPT-5-Codex是OpenAI专为代理式软件工程优化的编程智能体,搭载动态思考技术可连续自主编程7小时。深度解析版本演进、上下文压缩、沙箱执行、GPT-5.5三大跨越、与Claude Code/Cursor Agent竞品对比。
GPT-5
Codex
AI编程
Agentic Coding
动态思考
last30days-skill 深度实战:当 AI 学会「跨平台研究」——从 Reddit 投票到 Polymarket 赌注,构建你的全能 AI 研究助手的完全指南(2026)
编程
last30days-skill 深度实战:当 AI 学会「跨平台研究」——从 Reddit 投票到 Polymarket 赌注,构建你的全能 AI 研究助手的完全指南(2026)
2026-06-15 05:47:38 +0800 CST
view 60
last30days-skill 是一个革命性的 AI agent 技能,它打破了平台壁垒,能够并行搜索 Reddit、X、YouTube、TikTok、Hacker News、Polymarket、GitHub 等多个平台,通过真实用户的投票、点赞、评论和真金白银的赌注来评分内容,最终由 AI 裁判合成一份简洁而全面的摘要报告。本文深入剖析其核心原理、v3 引擎架构、安装配置、实战用法和性能优化技巧。
AI Agent
信息检索
跨平台研究
Reddit
X/Twitter
YouTube
Polymarket
GitHub
开源项目
OpenSkill深度解析:当Agent学会「无师自通」——自进化智能体的新范式颠覆了什么
编程
OpenSkill深度解析:当Agent学会「无师自通」——自进化智能体的新范式颠覆了什么
2026-06-09 11:46:59 +0800 CST
view 138
深入解析2026年最新研究OpenSkill框架——让AI Agent无需成功轨迹、预设Skills或监督信号即可自主获取可执行、可迁移的技能,刷新多项基准测试SOTA记录。
AI Agent
OpenSkill
自进化
深度学习
基准测试
DeerFlow 2.0 深度实战:字节跳动开源的超级智能体运行时——从 Super Agent Harness 架构到生产级部署的全链路解析
编程
DeerFlow 2.0 深度实战:字节跳动开源的超级智能体运行时——从 Super Agent Harness 架构到生产级部署的全链路解析
2026-05-08 06:10:07 +0800 CST
view 384
DeerFlow 2.0 深度解析:字节跳动开源的超级智能体运行时框架,49K Star 登顶 GitHub Trending。从四层微服务架构、Lead Agent 编排系统、Markdown 技能系统、Docker 沙箱执行环境、双层记忆系统到 MCP 协议支持,全方位解析这一革命性 AI Agent 框架的技术内涵与工程价值,并提供 Docker Compose 与 Kubernetes 生产级部署指南。
AI Agent
DeerFlow
字节跳动
LangGraph
Docker
开源项目
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
46
47
48
49
50
...
52
下一页