程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
首超人类!Agent S3:OSWorld基准测试72.60%的计算机使用智能体
案例
首超人类!Agent S3:OSWorld基准测试72.60%的计算机使用智能体
2026-05-06 07:15:01 +0800 CST
view 314
Agent S3首超人类!OSWorld基准测试72.60%,11K+Star开源计算机使用智能体,支持Mac/Windows/Linux,ICLR 2025 Best Paper,超越OpenAI Operator和Claude Computer-Use
AI Agent
计算机使用
OSWorld
SOTA
Agent S3
GUI自动化
Simular
A2A 协议深度解析:当多 Agent 系统告别「战国时代」——从协议原理到生产级实战完全指南(2026)
编程
A2A 协议深度解析:当多 Agent 系统告别「战国时代」——从协议原理到生产级实战完全指南(2026)
2026-06-15 18:20:12 +0800 CST
view 203
深入解析 Google A2A(Agent-to-Agent)协议:五大设计原则、Agent Card、Task 生命周期、JSON-RPC 方法全景,与 MCP 协议对比,并附 Python 生产级实战代码。
A2A
Agent
多Agent
MCP
协议解析
JSON-RPC
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 762
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
编程
Trae SOLO 深度实战:从 AI 辅助编程到自主交付——字节跳动 AI 原生 IDE 的架构革命与生产级实践
2026-05-23 03:46:21 +0800 CST
view 299
深度解析 Trae SOLO 模式的架构设计与生产级实践,从 Chat 到 SOLO 的三层演进、主 Agent + 子 Agent 协同机制、MCP 接入、多模型编排、性能优化技巧、CI/CD 集成等实战内容,附带完整项目演练。
Trae
SOLO模式
AI编程
字节跳动
Agent
自主开发
Trae SOLO 深度实战:当 AI 智能体接管开发全流程——从 SOLO Coder 双智能体架构到生产级 AI 原生编程的完全指南(2026)
编程
Trae SOLO 深度实战:当 AI 智能体接管开发全流程——从 SOLO Coder 双智能体架构到生产级 AI 原生编程的完全指南(2026)
2026-06-11 06:17:44 +0800 CST
view 171
深度拆解字节跳动 Trae SOLO 的双智能体架构,从 SOLO Coder/Builder 原理到生产级全栈应用实战,涵盖 Agent 编排、上下文压缩、模型路由、CUE 预测等核心技术
Trae
SOLO
AI编程
智能体
字节跳动
IDE
Agent
代码生成
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
案例
browser-harness:狂揽 11.9K Stars!让 AI Agent 真正丝滑操控浏览器
2026-05-11 10:18:42 +0800 CST
view 366
11.9K Stars 的开源项目 browser-harness,通过 CDP 框架直接连接 AI Agent 与真实 Chrome 浏览器,完全模拟人的行为,让 Agent 可以丝滑地浏览网页、搜索资料、填写表单、发布内容,不会触发任何反爬虫检测。
browser-harness
AI Agent
CDP
浏览器自动化
Claude Code
WebSocket
反爬虫
MCP 协议深度实战:从 Model Context Protocol 到 AI 工具生态互联互通——2026 年 AI Agent 互操作性完全指南
编程
MCP 协议深度实战:从 Model Context Protocol 到 AI 工具生态互联互通——2026 年 AI Agent 互操作性完全指南
2026-05-24 14:33:37 +0800 CST
view 596
深度解析 Model Context Protocol 架构原理、四大原语、代码实战与 2026 年生态现状——从 USB-C 类比到企业级 MCP Server 部署指南
MCP
Python SDK
JSON-RPC
AI Agent
工具生态
STDIO
Streamable HTTP
PraisonAI:5行代码部署多智能体团队的全功能AI框架
编程
PraisonAI:5行代码部署多智能体团队的全功能AI框架
2026-05-13 17:59:33 +0800 CST
view 417
PraisonAI是一个全功能多智能体AI框架,5行代码即可部署多智能体团队。支持AutoGen、CrewAI等多种后端,提供可视化界面和简化API,降低多Agent开发门槛。
PraisonAI
多智能体
AI Agent
开源框架
字节 Trae SOLO 深度解析:从 IDE 插件到独立智能体——SOLO 架构如何重新定义 AI 原生开发范式
编程
字节 Trae SOLO 深度解析:从 IDE 插件到独立智能体——SOLO 架构如何重新定义 AI 原生开发范式
2026-04-14 17:23:18 +0800 CST
view 1126
深度解析字节跳动 Trae SOLO 智能体系统的架构设计、核心能力与竞品对比,探讨 AI 原生开发范式的演进方向。
AI编程
Trae
SOLO
字节跳动
AI Agent
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
编程
TensorRT-LLM 深度实战:从 Blackwell 架构到 INT4 量化的 LLM 推理性能革命
2026-05-22 06:19:51 +0800 CST
view 371
深入解析TensorRT-LLM推理框架,从Paged KV Cache、连续批处理到INT4/INT8/FP8量化实战,覆盖Blackwell架构适配、Triton部署与K8s生产方案
TensorRT-LLM
LLM推理
量化
INT4
Blackwell
GPU优化
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 164
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
Sealtun深度实战:基于Kubernetes和WebSocket的安全隧道——从OAuth2登录到公网暴露的完全指南(2026)
编程
Sealtun深度实战:基于Kubernetes和WebSocket的安全隧道——从OAuth2登录到公网暴露的完全指南(2026)
2026-06-01 15:55:50 +0800 CST
view 260
深度剖析Sealtun——基于Kubernetes和WebSocket的安全隧道工具,从OAuth2设备流无密码登录到公网暴露,包含完整代码示例、架构分析、性能优化和生产级部署实践。
Sealtun
Kubernetes
WebSocket
OAuth2
云原生
内网穿透
TypeScript 7.0 深度实战:当微软用 Go 语言重写编译器——14年来最重大的底层革命与开发者生存指南(2026)
编程
TypeScript 7.0 深度实战:当微软用 Go 语言重写编译器——14年来最重大的底层革命与开发者生存指南(2026)
2026-06-21 17:25:50 +0800 CST
view 83
2026年6月18日微软发布TypeScript 7.0 RC,编译器从TypeScript自举迁移到Go,性能提升10倍。本文深度解析Go重写技术原理、性能数据、生态影响与实战指南。
TypeScript
TypeScript7
Go语言
编译器重构
性能优化
Microsoft
LSP
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
编程
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
2026-04-09 11:32:36 +0800 CST
view 664
NVIDIA发布的PersonaPlex在Moshi架构基础上增加了角色扮演和语音克隆能力,让AI可以扮演教师、客服等不同身份进行实时语音对话。本文从架构、代码、实战角度全面解析这项技术突破。
PersonaPlex
NVIDIA
Moshi
全双工语音
AI对话
角色扮演
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
编程
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
2026-06-10 17:46:59 +0800 CST
view 113
微软开源的 MarkItDown 工具如何解决 RAG 数据准备的核心痛点,深度解析 PDF、Word、Excel 等文档格式转换的生产级实践
MarkItDown
RAG
PDF
python
Microsoft
文档转换
编程
MarkItDown 深度实战:微软 AutoGen 团队开源的万能文档转 Markdown 引擎——从四层架构到 LLM/RAG 生产级集成的完全指南(2026)
2026-06-02 08:52:38 +0800 CST
view 204
微软AutoGen团队开源的MarkItDown能将PDF、Word、PPT、Excel、图片、音频等20+格式一键转为LLM友好的结构化Markdown。本文从四层架构、源码解析、代码实战、性能优化到生产级部署,彻底拆解这一11.9万星开源项目的核心技术。
MarkItDown
Microsoft
文档转换
Markdown
LLM
RAG
AutoGen
Python
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 603
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
SpacetimeDB 深度实战:当数据库成为服务器——从"光速开发"到生产级实时应用的完全指南(2026)
编程
SpacetimeDB 深度实战:当数据库成为服务器——从"光速开发"到生产级实时应用的完全指南(2026)
2026-06-11 02:45:57 +0800 CST
view 122
SpacetimeDB 是一款创新的实时数据库,它颠覆了传统"服务器+数据库"架构,让数据库同时成为服务器。本文深入讲解 SpacetimeDB 的核心概念、Rust 模块开发、实时数据同步原理、性能优化技巧以及生产级部署方案,并通过实战案例展示如何构建实时协作应用。
SpacetimeDB
Rust
实时数据库
数据库即服务器
WebSocket
Trae 深度解析:字节跳动如何用 SOLO 模式重新定义 AI 原生 IDE
编程
Trae 深度解析:字节跳动如何用 SOLO 模式重新定义 AI 原生 IDE
2026-05-10 13:24:55 +0800 CST
view 697
Trae 是字节跳动推出的 AI 原生 IDE,以 SOLO 模式为核心,实现从「辅助编码」到「自主协作」的范式转变。本文深入解析其技术架构、SOLO Coder 与 SOLO Builder 双智能体、MTC 模式、MCP 插件生态,并与 Cursor、GitHub Copilot、Windsurf 等竞品进行全面对比。
Trae,AI编程,字节跳动,SOLO模式,IDE,AI原生
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 678
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
编程
MCP 2026 深度解析:AI推理性能瓶颈诊断的12个隐性耗时陷阱——从TensorRT-LLM到vLLM再到Triton的全引擎实战
2026-04-30 14:21:13 +0800 CST
view 375
深度解析MCP 2026基准测试框架,拆解TensorRT-LLM、vLLM、Triton三大推理引擎的12个隐性耗时陷阱,提供可落地的诊断方法与修复路径。
AI推理
性能优化
TensorRT-LLM
vLLM
Triton
MCP2026
GPU优化
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
编程
2026 大模型推理框架终极对决:vLLM 0.5 vs TGI 2.0 vs TensorRT-LLM 1.8 vs DeepSpeed-MII 0.9——从架构原理到生产级部署的完全指南
2026-06-16 23:24:43 +0800 CST
view 128
深度对比四大主流LLM推理框架:vLLM 0.5、TGI 2.0、TensorRT-LLM 1.8、DeepSpeed-MII 0.9。从PagedAttention架构原理、FlashAttention优化、量化支持到生产级部署实战,包含统一环境下的性能测试数据与代码示例,帮助你做出最优选型决策。
LLM
推理框架
vLLM
TensorRT
DeepSpeed
性能优化
AI
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 564
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 305
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
18
19
20
21
22
...
55
下一页