程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
编程
TurboQuant 深度实战:Google 的 KV 缓存压缩算法完全指南(2026)
2026-06-08 20:52:38 +0800 CST
view 213
2026年3月Google Research在ICLR 2026发表TurboQuant算法,将LLM的KV缓存压缩至3-bit,实现6倍内存缩减和8倍推理加速。本文深入剖析TurboQuant的技术原理,并提供生产级部署指南。
TurboQuant
KV缓存压缩
LLM推理优化
量化算法
Google Research
ICLR2026
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
编程
腾讯云 Cube Sandbox 全栈开源解读:AI Agent 安全执行底座的架构与实战
2026-04-26 04:41:26 +0800 CST
view 1113
深度解析腾讯云开源的 Cube Sandbox:业内首个兼顾硬件级隔离与亚百毫秒启动的 AI Agent 沙箱服务,从架构设计到生产实战全指南
Cube Sandbox
AI Agent
云原生
沙箱安全
MicroVM
开源
Superpowers 深度实战:123K Star 的 AI 编程工作流框架——从 Process over Prompt 到工程化 Agent 闭环系统
编程
Superpowers 深度实战:123K Star 的 AI 编程工作流框架——从 Process over Prompt 到工程化 Agent 闭环系统
2026-05-07 10:40:42 +0800 CST
view 503
深度解析 Superpowers——123K Star 的 AI 编程工作流框架。从三层架构到7步核心工作流,全面剖析如何让AI编程助手从实习生变成资深工程师。
AI编程
Claude Code
工作流框架
Agent
Superpowers
腾讯开源Agent Memory:上下文卸载+Mermaid任务画布,Token消耗降低61%
编程
腾讯开源Agent Memory:上下文卸载+Mermaid任务画布,Token消耗降低61%
2026-05-14 15:31:52 +0800 CST
view 382
腾讯云开源TencentDB Agent Memory,通过上下文卸载+Mermaid任务画布为Agent长任务提供记忆压缩,实测Token消耗降低61%同时提升成功率,兼容OpenClaw/Hermes,零依赖SQLite本地存储。
AI Agent
腾讯开源
上下文管理
Token优化
Mermaid
Docker & Kubernetes 2026 云原生架构深度实战:从容器编排到 Service Mesh 全链路生产级完全指南
编程
Docker & Kubernetes 2026 云原生架构深度实战:从容器编排到 Service Mesh 全链路生产级完全指南
2026-06-14 21:48:22 +0800 CST
view 252
深度解析2026年云原生技术栈的核心特性,从Docker BuildKit、Kubernetes Gateway API到Istio Ambient Mesh、Cilium eBPF,一套完整的云原生实战指南
Docker
Kubernetes
云原生
Service Mesh
Istio
Cilium
eBPF
OpenTelemetry
可观测性
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
编程
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
2026-06-27 18:46:30 +0800 CST
view 104
智谱AI发布GLM-5.2旗舰开源大模型:744B MoE架构+40B激活参数、1M百万Token稳定上下文、异步Agent RL训练、IndexShare稀疏注意力将计算量降低2.9倍。SWE-bench Pro编程能力超越GPT-5.5,MIT协议完全开源。本文深度解析其技术架构、训练方法、性能评测与生产实践。
GLM-5.2
Z.ai
开源大模型
MoE
异步Agent RL
百万上下文
MIT协议
FinceptTerminal 深度实战:当 C++20 遇上金融终端——从 Qt6 原生渲染到 37 个 AI 智能体与 QuantLib 量化引擎的生产级完全指南(2026)
编程
FinceptTerminal 深度实战:当 C++20 遇上金融终端——从 Qt6 原生渲染到 37 个 AI 智能体与 QuantLib 量化引擎的生产级完全指南(2026)
2026-06-14 22:28:06 +0800 CST
view 253
开源金融终端 Fincept Terminal v4 深度实战:C++20 原生渲染、37 个 AI 投资智能体、QuantLib 18 模块量化引擎、100+ 数据源、16 家券商接入
FinceptTerminal
C++20
Qt6
金融终端
量化交易
AI智能体
QuantLib
开源金融
Temporal 深度实战:当「持久化执行」重塑分布式系统可靠性——从事件溯源到 Serverless Workers、从 Workflow Streams 到 AI Agent 编排的生产级完全指南(2026)
编程
Temporal 深度实战:当「持久化执行」重塑分布式系统可靠性——从事件溯源到 Serverless Workers、从 Workflow Streams 到 AI Agent 编排的生产级完全指南(2026)
2026-06-20 08:56:35 +0800 CST
view 179
深入剖析 Temporal 的持久化执行架构、Replay 2026 四大新特性(Serverless Workers、Standalone Activities、Workflow Streams、AI Agent 集成),配大量 Python 代码示例的生产级完全指南
Temporal
Durable Execution
Serverless Workers
Workflow Streams
Standalone Activities
分布式系统
事件溯源
AI Agent
Elasticsearch 9.4 深度解析:从搜索引擎到 Agent 平台,2026 年 Elastic 的战略级重构
编程
Elasticsearch 9.4 深度解析:从搜索引擎到 Agent 平台,2026 年 Elastic 的战略级重构
2026-05-14 17:40:49 +0800 CST
view 534
Elasticsearch 9.4.0 于 2026 年 4 月 30 日发布。核心变化:Elastic 正在从搜索 + 日志老三件套,重写成一个 Agent 平台。深度解析 Agent Builder、MCP 协议集成、向量搜索优化、Kibana AI 增强、性能基准测试。
Elasticsearch
向量搜索
Agent
AI
Kibana
MCP
搜索
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
编程
vLLM 深度实战:当 LLM 推理遇上 PagedAttention——从 KV 缓存管理到生产级高并发服务的完全指南(2026)
2026-06-08 22:52:24 +0800 CST
view 277
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
编程
Anthropic 22亿收购Stainless:当SDK自动生成成为AI战争的战略高地
2026-05-19 15:49:10 +0800 CST
view 417
Anthropic以超过22亿元收购Stainless,独占SDK自动生成与MCP服务器生成基础设施,深度解析技术架构与行业影响
Anthropic
Stainless
SDK
MCP
AI工具链
OpenAPI
OpenAI Codex 2026 深度实战:从 CLI 到手机遥控——AI 编程 Agent 的全栈进化完全指南
编程
OpenAI Codex 2026 深度实战:从 CLI 到手机遥控——AI 编程 Agent 的全栈进化完全指南
2026-05-29 06:37:51 +0800 CST
view 720
2026年5月OpenAI Codex密集更新全面解析
AI编程
OpenAI
Codex
GPT-5
CLI
自动化
Agent
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
编程
2026 年 vLLM 推理服务实战:PagedAttention 原理、分布式部署与性能调优完全指南
2026-06-08 22:53:03 +0800 CST
view 184
深度解析vLLM推理框架的核心原理、PagedAttention创新机制、分布式推理架构,以及生产环境部署的最佳实践。
vLLM
PagedAttention
LLM推理
KV缓存
分布式推理
小米 MiMo Code 深度解析:国产开源 AI 编程助手的架构设计与生产级实战
编程
小米 MiMo Code 深度解析:国产开源 AI 编程助手的架构设计与生产级实战
2026-06-27 20:42:29 +0800 CST
view 69
深度解析小米开源的终端原生AI编程助手MiMo Code,从MoE架构、多Token预测、混合注意力到生产级实战,提供完整的技术分析与使用指南
MiMo Code
AI编程
开源
小米
MoE架构
终端Agent
国产工具
编程助手
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 494
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
Mano-P + Cider:4B模型本地操控Mac,端侧GUI Agent新时代
案例
Mano-P + Cider:4B模型本地操控Mac,端侧GUI Agent新时代
2026-05-07 13:34:32 +0800 CST
view 368
明略科技开源Mano-P(4B量化模型本地操控Mac)和Cider(MLX推理加速框架)。476 tokens/s预填充,76 tokens/s解码,峰值内存4.3GB,完全本地运行数据不出设备,离线长任务自主规划
GUI Agent
端侧AI
Apple Silicon
MLX
视觉理解
本地运行
Mano-P
Cider
容器运行时战争 2026:Docker 被架空的真相——从 Containerd、Podman 到 Nix 的深度实战与选型指南
编程
容器运行时战争 2026:Docker 被架空的真相——从 Containerd、Podman 到 Nix 的深度实战与选型指南
2026-05-29 07:08:01 +0800 CST
view 385
2026年容器运行时深度对比:Docker被架空的真相,Containerd、Podman、Nix、CRI-O全链路实战,含架构分析、性能测试、安全对比与生产级选型决策树
Docker
Containerd
Podman
Nix
容器运行时
Kubernetes
云原生
OCI
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
编程
AI-Scientist-v2 深度实战:当 AI 从「辅助工具」进化成「第一作者」——从树搜索自动化到顶会同行评审的完全指南(2026)
2026-06-08 23:26:28 +0800 CST
view 189
AI-Scientist-v2是Sakana AI联合牛津大学等机构开发的自动化科研系统,能从零生成科研创意、执行实验并撰写论文。本文深入剖析其树搜索算法、并行代理架构和GPU调度策略,探讨AI对科研生态的影响。
AI-Scientist-v2
树搜索
自动化科研
AI编程
Sakana AI
并行代理
GPU调度
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
编程
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
2026-06-15 00:18:14 +0800 CST
view 244
深度剖析 Redis 之父 antirez 的最新项目 ds4 (DwarfStar),专为 DeepSeek V4 Flash 设计的本地推理引擎。涵盖非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 优化、内置 Coding Agent 等核心技术。
ds4
DwarfStar
antirez
Redis
大模型推理
MoE架构
量化
Claude-Mem 深度实战:56K+ Star 的 Claude Code 持久记忆插件——从 Hook 生命周期架构到渐进式检索的全链路解析
编程
Claude-Mem 深度实战:56K+ Star 的 Claude Code 持久记忆插件——从 Hook 生命周期架构到渐进式检索的全链路解析
2026-05-07 14:38:24 +0800 CST
view 413
深度解析 Claude-Mem 的 Hook 生命周期架构、异步队列处理、AI 压缩、FTS5 全文搜索和渐进式披露检索机制,附完整代码实战
Claude Code
AI Agent
持久记忆
Hook
FTS5
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
编程
Agent Skills 深度实战:当 AI 学会「工程师纪律」——从 Addy Osmani 的 7 个斜杠命令到生产级 AI 编程工作流的完全指南(2026)
2026-06-15 00:50:09 +0800 CST
view 308
Agent Skills 是 Google 工程总监 Addy Osmani 开源的 AI 编程工程技能库,通过 7 个斜杠命令(/spec、/plan、/build、/test、/review、/code-simplify、/ship)将软件开发六阶段生命周期固化到 AI 工作流中,让 AI 从「代码生成器」升级为「工程助手」。
AI编程
Agent Skills
Addy Osmani
Claude Code
工程化
软件开发
Skill
生产级
DeerFlow 2.0 深度解析:字节跳动开源的智能体时代操作系统
编程
DeerFlow 2.0 深度解析:字节跳动开源的智能体时代操作系统
2026-04-17 05:39:08 +0800 CST
view 740
DeerFlow 2.0 是字节跳动开源的 Super Agent 运行时基础设施,登顶 GitHub Trending 榜首。本文深度解析其架构设计、核心原理、实战部署与性能优化。
DeerFlow
AI Agent
字节跳动
LangGraph
MCP
开源项目
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
编程
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
2026-04-26 13:13:17 +0800 CST
view 598
深度解析字节跳动开源DeerFlow 2.0超级智能体执行底座:63K Star背后的架构设计哲学,从LangGraph编排引擎、渐进式技能加载、隔离式子智能体到Docker/K8s沙箱安全隔离,含完整代码实战与生产部署指南
DeerFlow
AI Agent
字节跳动
LangGraph
超级智能体
沙箱
多智能体编排
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
2026-06-15 01:18:03 +0800 CST
view 317
2026年6月英伟达发布全球首款全模态物理AI世界模型Cosmos 3。本文从MoT混合架构、代码实战、Agent Skills工作流、性能分析、生产部署五个维度,带你彻底搞懂这个被业界定义为物理AI产业「安卓时刻」的技术突破。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
机器人
自动驾驶
深度学习
AI Agent
仿真
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
43
44
45
46
47
...
51
下一页