程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
编程
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
2026-06-08 20:52:38 +0800 CST
view 213
2026年3月Google Research在ICLR 2026发表TurboQuant算法,将LLM的KV缓存压缩至3-bit,实现6倍内存缩减和8倍推理加速。本文深入剖析TurboQuant的技术原理,并提供生产级部署指南。
TurboQuant
KV缓存压缩
LLM推理优化
量化算法
Google Research
ICLR2026
Nanobot:港大开源4000行代码的超轻量AI助手,仅OpenClaw代码量的1%,却复刻了核心战力
编程
Nanobot:港大开源4000行代码的超轻量AI助手,仅OpenClaw代码量的1%,却复刻了核心战力
2026-04-16 19:06:52 +0800 CST
view 774
Nanobot是香港大学数据科学实验室开源的超轻量AI助手框架,仅用约4000行代码实现了OpenClaw的核心能力,支持9大聊天平台接入和数十种LLM模型,23.1K Stars。
AI助手
OpenClaw
港大
Python
开源
MIT
轻量级
Agent
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
编程
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
2026-04-26 04:41:26 +0800 CST
view 1113
深度解析腾讯云开源的 Cube Sandbox:业内首个兼顾硬件级隔离与亚百毫秒启动的 AI Agent 沙箱服务,从架构设计到生产实战全指南
Cube Sandbox
AI Agent
云原生
沙箱安全
MicroVM
开源
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
编程
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
2026-06-27 18:46:30 +0800 CST
view 111
智谱AI发布GLM-5.2旗舰开源大模型:744B MoE架构+40B激活参数、1M百万Token稳定上下文、异步Agent RL训练、IndexShare稀疏注意力将计算量降低2.9倍。SWE-bench Pro编程能力超越GPT-5.5,MIT协议完全开源。本文深度解析其技术架构、训练方法、性能评测与生产实践。
GLM-5.2
Z.ai
开源大模型
MoE
异步Agent RL
百万上下文
MIT协议
LangGraph:告别if-else,用图结构编排复杂AI工作流,循环和人工干预天然支持
编程
LangGraph:告别if-else,用图结构编排复杂AI工作流,循环和人工干预天然支持
2026-04-16 19:09:33 +0800 CST
view 528
LangGraph是langchain-ai开源的AI Agent工作流编排框架(25K Stars),用图结构替代LangChain的链式调用,支持循环、条件分支、检查点和人工干预,适合复杂多步骤Agent。
LangGraph
AI
工作流
LangChain
Agent
开源
Python
图结构
Elasticsearch 9.4 深度解析:从搜索引擎到 Agent 平台,2026 年 Elastic 的战略级重构
编程
Elasticsearch 9.4 深度解析:从搜索引擎到 Agent 平台,2026 年 Elastic 的战略级重构
2026-05-14 17:40:49 +0800 CST
view 534
Elasticsearch 9.4.0 于 2026 年 4 月 30 日发布。核心变化:Elastic 正在从搜索 + 日志老三件套,重写成一个 Agent 平台。深度解析 Agent Builder、MCP 协议集成、向量搜索优化、Kibana AI 增强、性能基准测试。
Elasticsearch
向量搜索
Agent
AI
Kibana
MCP
搜索
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 281
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
编程
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
2026-05-19 15:49:10 +0800 CST
view 418
Anthropic以超过22亿元收购Stainless,独占SDK自动生成与MCP服务器生成基础设施,深度解析技术架构与行业影响
Anthropic
Stainless
SDK
MCP
AI工具链
OpenAPI
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 185
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 496
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
编程
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
2026-06-08 23:26:28 +0800 CST
view 191
AI-Scientist-v2是Sakana AI联合牛津大学等机构开发的自动化科研系统,能从零生成科研创意、执行实验并撰写论文。本文深入剖析其树搜索算法、并行代理架构和GPU调度策略,探讨AI对科研生态的影响。
AI-Scientist-v2
树搜索
自动化科研
AI编程
Sakana AI
并行代理
GPU调度
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
编程
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
2026-06-15 00:18:14 +0800 CST
view 244
深度剖析 Redis 之父 antirez 的最新项目 ds4 (DwarfStar),专为 DeepSeek V4 Flash 设计的本地推理引擎。涵盖非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 优化、内置 Coding Agent 等核心技术。
ds4
DwarfStar
antirez
Redis
大模型推理
MoE架构
量化
Chrome DevTools MCP 1.3 深度实战:当 Google 把浏览器控制权交给 AI Agent——从 CDP + MCP 双协议架构到 49 个生产级工具、从性能 Trace 到堆内存分析的完全指南(2026)
编程
Chrome DevTools MCP 1.3 深度实战:当 Google 把浏览器控制权交给 AI Agent——从 CDP + MCP 双协议架构到 49 个生产级工具、从性能 Trace 到堆内存分析的完全指南(2026)
2026-06-20 11:26:28 +0800 CST
view 129
Google 官方 Chrome DevTools MCP 1.3 完全指南:49 个 MCP 工具、CDP + MCP 双协议架构、性能 Trace、内存堆快照、Lighthouse 审计与生产级安全实践。
Chrome DevTools
MCP
AI Agent
浏览器自动化
性能优化
前端调试
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
编程
Headroom 深度解析:如何让 LLM Token 消耗减少 60-95% 而质量不降——2026 年 AI Agent 上下文压缩完全指南
2026-06-15 01:49:57 +0800 CST
view 226
深度解析 GitHub Trending 2026 榜首项目 Headroom,详解如何让 LLM Token 消耗减少 60-95% 而回答质量不降,含完整代码示例与生产成本优化方案。
LLM
Token压缩
AI Agent
上下文工程
Headroom
Python
Rust
成本优化
Chrome DevTools MCP 1.3 完全实战:AI 编程助手如何接管 Chrome 的 49 个工具——从 CDP + MCP 架构到性能优化、内存调试与 CI/CD 落地指南(2026)
编程
Chrome DevTools MCP 1.3 完全实战:AI 编程助手如何接管 Chrome 的 49 个工具——从 CDP + MCP 架构到性能优化、内存调试与 CI/CD 落地指南(2026)
2026-06-20 11:28:34 +0800 CST
view 139
Google 官方 Chrome DevTools MCP 1.3 完全指南:49 个 MCP 工具、CDP + MCP 双协议架构、性能 Trace、内存堆快照、Lighthouse 审计与生产级安全实践。
Chrome DevTools
MCP
AI Agent
浏览器自动化
性能优化
前端调试
Ansible 2026 深度解析:Red Hat 向 AI 智能体开放自动化平台,MCP 协议让 AI 直接操控基础设施
编程
Ansible 2026 深度解析:Red Hat 向 AI 智能体开放自动化平台,MCP 协议让 AI 直接操控基础设施
2026-05-15 02:43:18 +0800 CST
view 426
Red Hat 2026 年 5 月向 AI 智能体开放 Ansible 自动化平台:MCP Server 正式商用让 Claude Code/Codex CLI 直接调用 Ansible,编排器人工审批保障安全。深度解析架构、安全三层机制、实战场景与竞品对比。
Ansible,MCP,AI Agent,DevOps,Red Hat,自动化
Warp 深度实战:49K+ Star 的 AI Agent 原生终端——从 Block 架构到 Oz 云代理平台的全链路解析
编程
Warp 深度实战:49K+ Star 的 AI Agent 原生终端——从 Block 架构到 Oz 云代理平台的全链路解析
2026-05-07 21:38:59 +0800 CST
view 412
深入剖析 Warp 终端的开源架构,从 Block-Based 输出模型到 GPU 加速渲染,从 AI Agent 原生集成到 Oz 云代理平台,全面解读 49K+ Star 背后的技术革新。
Warp
终端
Rust
AI Agent
GPU渲染
MCP
Skills
OpenViking:给 AI Agent 装上跨会话、跨平台的长期记忆
编程
OpenViking:给 AI Agent 装上跨会话、跨平台的长期记忆
2026-06-09 07:47:48 +0800 CST
view 194
OpenViking 是火山引擎开源的 Agent 记忆中枢,通过 MCP 接入 Trae、Codex、Claude Code 等工具,实现设计规范的自动提取、精准召回和跨平台共享。
AI Agent
MCP
长期记忆
前端开发
2026年AI架构突破全景解析:从 Kimi Attention Residuals 到存算一体——告别参数内卷,走向效率革命
编程
2026年AI架构突破全景解析:从 Kimi Attention Residuals 到存算一体——告别参数内卷,走向效率革命
2026-05-30 09:40:11 +0800 CST
view 386
深度解析2026年AI架构五大突破:Attention Residuals、存算一体、多模态原生、自我学习、量子AI,从算法到硬件全方位革新
AI架构
Attention Residuals
存算一体
量子AI
多模态原生
告别传统工单系统:开源客服平台 Tentix 用向量知识库让 AI 真正懂业务
编程
告别传统工单系统:开源客服平台 Tentix 用向量知识库让 AI 真正懂业务
2026-04-17 10:00:51 +0800 CST
view 527
本文介绍开源客服系统 Tentix,它将历史工单、对话、文档统一沉淀到 PostgreSQL + pgvector 向量知识库中,支持 MCP 扩展,让 AI 客服越跑越懂业务,不再工单电子化。
开源
Tentix
客服系统
向量知识库
AI
pgvector
MCP
Apache Flink 2.0 深度解析:9 年磨一剑的实时数据革命,从 API 大清洗到存算分离
编程
Apache Flink 2.0 深度解析:9 年磨一剑的实时数据革命,从 API 大清洗到存算分离
2026-05-15 06:14:26 +0800 CST
view 407
Flink 2.0是9年来首次大版本更新,核心API大清洗、存算分离状态管理、物化表、批作业自适应执行、Flink Agents流式AI Agent,完整迁移实战与性能基准测试。
Flink
流处理
存算分离
实时数据
Flink Agents
字节跳动DeerFlow 2.0:当AI Agent从'会说话'进化到'能做事'
编程
字节跳动DeerFlow 2.0:当AI Agent从'会说话'进化到'能做事'
2026-04-08 10:38:43 +0800 CST
view 708
深度解析字节跳动开源的DeerFlow 2.0,57k Star的超级智能体运行时框架,四大核心模块解决AI Agent痛点,从对话工具进化为执行系统。
AI
Agent
开源
字节跳动
技术趋势
OpenSkill深度解析:当Agent学会「无师自通」——自进化智能体的新范式颠覆了什么
编程
OpenSkill深度解析:当Agent学会「无师自通」——自进化智能体的新范式颠覆了什么
2026-06-09 11:46:59 +0800 CST
view 250
深入解析2026年最新研究OpenSkill框架——让AI Agent无需成功轨迹、预设Skills或监督信号即可自主获取可执行、可迁移的技能,刷新多项基准测试SOTA记录。
AI Agent
OpenSkill
自进化
深度学习
基准测试
html-anything开源:75套Skill模板+零API Key,Agent帮你把任何内容变成专业HTML
编程
html-anything开源:75套Skill模板+零API Key,Agent帮你把任何内容变成专业HTML
2026-05-15 08:54:52 +0800 CST
view 1201
html-anything是nexu-io团队开源的HTML编辑器,75套专业Skill模板覆盖9种交付形态,自动识别18种Code Agent CLI零API Key零成本,一键导出公众号小红书知乎等多平台。
开源项目
HTML编辑器
AI Agent
模板工具
内容创作
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
63
64
65
66
67
68
下一页