程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
编程
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
2026-04-14 18:24:03 +0800 CST
view 424
深入解析 GitHub 26k Stars 的开源企业级 AI 平台 Onyx,涵盖 LLM-Agnostic 架构设计、混合检索+知识图谱 RAG 系统、定制化 Agent、多数据源连接器、企业级安全等核心能力
AI平台
RAG
开源
企业级
Onyx
Agent
多模型
Kubernetes
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
资讯
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
2026-04-23 21:18:45 +0800 CST
view 593
2026年4月23日,腾讯发布并开源新一代大模型混元Hy3preview,总参数295B、激活参数21B的MoE架构,支持256K超长上下文,推理效率提升40%,API最低1.2元/百万tokens。在复杂推理、代码与Agent能力上表现突出,接近GPT-5.4级别,数学推理创国内最高纪录。已接入腾讯云、元宝等多条产品线,并上架TokenHub。
人工智能
大模型
腾讯
开源
MoE
推理
代码生成
Agent
云计算
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 360
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
MiniMax M3 深度实战:当稀疏注意力打破百万 Token 墙——从 MSA 架构原理到 1M 上下文工程实践、原生多模态与 Agent 集群的生产级完全指南(2026)
编程
MiniMax M3 深度实战:当稀疏注意力打破百万 Token 墙——从 MSA 架构原理到 1M 上下文工程实践、原生多模态与 Agent 集群的生产级完全指南(2026)
2026-06-19 07:26:01 +0800 CST
view 58
深度解析MiniMax M3的自研MSA稀疏注意力架构,从KV outer gather Q设计到1M上下文工程实践,包含代码示例、性能优化和部署指南
MiniMax
M3
MSA
稀疏注意力
1M上下文
多模态
Agent
大模型
OpenCode 深度实战:当开源 AI 编程 Agent 登上 GitHub Trending 榜首——从 160K Stars 到 75 模型架构、从 Model-Agnostic 范式到华为 DevEco Code 的完全指南(2026)
编程
OpenCode 深度实战:当开源 AI 编程 Agent 登上 GitHub Trending 榜首——从 160K Stars 到 75 模型架构、从 Model-Agnostic 范式到华为 DevEco Code 的完全指南(2026)
2026-06-19 13:55:36 +0800 CST
view 375
深度解析 2026 年登顶 GitHub Trending 的开源 AI 编程 Agent OpenCode:从 160K Stars、75 模型架构、Provider/MCP/Skill/Plugin 四层扩展体系、Go 语言 Agent 引擎实现,到华为 DevEco Code 商业应用,全面掌握模型无关 AI 编程工具的设计哲学与工程实践。
OpenCode
GitHub
AIAgent
模型无关
MCP协议
Go语言
HarmonyOS
DevEcoCode
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
编程
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
2026-06-06 06:06:41 +0800 CST
view 415
微软Build 2026开发者大会全景深度解析:七款MAI自研模型、Scout智能体、MXC安全沙箱、Surface RTX Spark Dev Box、Project Solara全新设备平台的完整技术分析。
微软
Build 2026
MAI模型
AI Agent
MXC
GitHub Copilot
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
2026-06-15 01:18:03 +0800 CST
view 173
2026年6月英伟达发布全球首款全模态物理AI世界模型Cosmos 3。本文从MoT混合架构、代码实战、Agent Skills工作流、性能分析、生产部署五个维度,带你彻底搞懂这个被业界定义为物理AI产业「安卓时刻」的技术突破。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
机器人
自动驾驶
深度学习
AI Agent
仿真
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
案例
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
2026-05-07 22:18:24 +0800 CST
view 403
GuaDa AI开源项目:功能完备的AI Agent系统,支持ReAct Agent、RAG知识库、MCP协议、Skills技能框架热插拔、多平台机器人(QQ/飞书/企业微信)。NestJS+Vue 3全栈TypeScript,SQLite+sqlite-vec轻量级部署
AI Agent
ReAct
MCP
Skills
RAG
多模型
NestJS
Vue 3
开源
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 132
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
编程
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
2026-05-31 08:51:02 +0800 CST
view 246
全面解密GPT-5.5三大核心技术突破:原生全模态架构、硬件协同设计、Agent原生训练目标。从架构原理到API调用,涵盖性能基准、成本分析、安全评估与生产级部署最佳实践。
GPT-5.5
OpenAI
AI大模型
Agent
API
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 448
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 143
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 577
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
Deno 深度实战:当 JavaScript 运行时遇上 Rust + V8 —— 从安全模型到生产级部署的完全指南(2026)
编程
Deno 深度实战:当 JavaScript 运行时遇上 Rust + V8 —— 从安全模型到生产级部署的完全指南(2026)
2026-06-10 09:22:22 +0800 CST
view 107
Deno 深度实战指南,从架构原理到生产部署,涵盖安全模型、Web标准兼容、TypeScript支持、去中心化模块系统等核心特性,并提供高性能Web API、CLI工具、文件系统操作、WebSocket实时通信等实战代码。
Deno
JavaScript
TypeScript
Rust
安全模型
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
编程
GPT-6 深度解析:当"土豆"成为 AGI 的最后一公里
2026-04-09 08:39:00 +0800 CST
view 495
OpenAI GPT-6 深度解析:代号Spud,Symphony原生多模态架构、5-6万亿MoE参数、200万Token上下文、双系统推理框架,定位AGI最后一公里。含核心技术解读、架构分析、代码示例。
AI
GPT-6
OpenAI
AGI
大模型
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
编程
Unsloth 深度实战:从显存爆炸到 70% 压缩——本地大模型微调的工程化革命与生产级实践
2026-05-22 16:15:29 +0800 CST
view 425
Unsloth通过底层算子优化让大模型微调显存降低70%、速度提升2-5x,本文从原理到生产实战全方位拆解,含完整代码。
Unsloth
LoRA
QLoRA
大模型微调
本地训练
边缘AI推理深度实战:当推理成为AI落地的"最后一公里"——从TinyML到生产级边缘部署的完全指南(2026)
编程
边缘AI推理深度实战:当推理成为AI落地的"最后一公里"——从TinyML到生产级边缘部署的完全指南(2026)
2026-06-10 16:46:50 +0800 CST
view 215
深入剖析边缘AI推理的技术原理、工具链、优化方法与生产实战,涵盖TinyML、ONNX Runtime、模型压缩、边缘硬件加速等内容。
边缘AI
TinyML
ONNX Runtime
模型压缩
边缘推理
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
编程
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
2026-04-29 05:42:47 +0800 CST
view 378
深度解析开源AI网关LiteLLM:100+大模型统一接入、虚拟密钥体系、负载均衡与故障降级、MCP/A2A网关、生产级Docker部署实战
LiteLLM
AI网关
大模型
LLM
API网关
Python
Docker
云原生
女娲.skill 深度解析:当造人从神话变成代码,把乔布斯、芒格、马斯克的思维方式变成可运行的AI技能
编程
女娲.skill 深度解析:当造人从神话变成代码,把乔布斯、芒格、马斯克的思维方式变成可运行的AI技能
2026-04-10 02:43:26 +0800 CST
view 2254
女娲skill深度解析:输入人名自动蒸馏认知操作系统,六路Agent Swarm并行采集、三重心智模型验证、表达DNA量化,乔布斯芒格马斯克等13位人物一键生成可运行Skill
AI
Skill
认知蒸馏
心智模型
Claude Code
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 322
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
GitHub Rubber Duck 深度解析:当 Claude 遇上 GPT-5.4,AI 编程进入「第二意见」时代
编程
GitHub Rubber Duck 深度解析:当 Claude 遇上 GPT-5.4,AI 编程进入「第二意见」时代
2026-04-10 03:24:31 +0800 CST
view 631
GitHub Rubber Duck 实验性功能深度解析:通过跨模型审查机制,Claude Sonnet 4.6 性能提升74.7%,AI编程进入第二意见时代
GitHub
Copilot
Rubber Duck
AI编程
Claude
GPT-5.4
代码审查
跨模型协作
NVIDIA Cosmos 3 全模态物理AI深度解读:当世界模型从「纸上谈兵」走向「具身智能」——从 MoT 架构革命到万亿级合成数据的工业级落地指南(2026)
编程
NVIDIA Cosmos 3 全模态物理AI深度解读:当世界模型从「纸上谈兵」走向「具身智能」——从 MoT 架构革命到万亿级合成数据的工业级落地指南(2026)
2026-06-16 16:15:52 +0800 CST
view 94
2026年6月英伟达开源 Cosmos 3 全模态世界模型,本文从 MoT 架构、SILA 数据引擎、训练配方、推理部署四个维度进行程序员视角的深度解读,配代码示例与性能对比,探讨物理AI开发者的新机遇。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
具身智能
开源
机器人
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 158
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 151
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
39
下一页