程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
编程
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
2026-04-13 02:56:20 +0800 CST
view 658
深度解析Hermes Agent的工程实现:四层记忆架构(SQLite+FTS5)、技能自生成闭环、与OpenClaw的本质对比,以及这条「自我进化」路线对AI工具链未来的意义。
AI Agent
Hermes Agent
自我进化
记忆架构
Nous Research
技能系统
SQLite
机器学习
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
编程
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
2026-04-13 11:23:13 +0800 CST
view 192
2026年3月Anthropic发布Claude顾问策略,彻底颠覆传统AI Agent工作模式。通过让Opus退居幕后当顾问,Sonnet/Haiku冲在前面当执行者,实现性能与成本的最佳平衡。本文深度解析其技术架构、性能数据与工程实践。
Claude
AI Agent
Anthropic
Advisor Strategy
Sonnet
Haiku
Opus
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 256
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
Hermes Agent 最大的彩蛋:90%的人不知道的斜杠命令完全指南
编程
Hermes Agent 最大的彩蛋:90%的人不知道的斜杠命令完全指南
2026-04-27 06:20:34 +0800 CST
view 72
Nous Research出品的Hermes Agent拥有极其丰富的斜杠命令体系,涵盖日常对话、专业开发、多平台消息网关等完整场景。本文按使用频率分类整理,助你快速掌握这把AI瑞士军刀。
Hermes Agent
Nous Research
斜杠命令
AI Agent
OpenRouter
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 336
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
编程
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
2026-04-09 05:52:11 +0800 CST
view 716
MemPalace 以 96.6% LongMemEval 召回率成为目前评分最高的 AI 记忆系统。本文深度解析其宫殿记忆法架构、四层记忆栈、AAAK 压缩方言,以及与 Claude Code 的集成方案。
AI
memory
vector-database
RAG
Claude
open-source
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 167
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 61
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
编程
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
2026-05-01 04:40:16 +0800 CST
view 28
英伟达发布Nemotron 3 Nano Omni开源多模态模型,30B-A3B MoE架构,统一视觉音频语言编码,吞吐量9倍提升,六大排行榜榜首,富士康甲骨文等已采用。
英伟达
多模态
开源
AI智能体
Nemotron
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
编程
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
2026-05-01 09:34:12 +0800 CST
view 20
深度解析 Mojo 语言:基于 MLIR 的 AI 基础设施编程语言,比 Python 快 68000 倍的秘密,从架构设计、编译原理、性能优化到代码实战的完整拆解
Mojo
AI
编译器
性能优化
MLIR
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 379
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
2026-04-22 16:02:39 +0800 CST
view 161
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
2026-04-22 16:03:28 +0800 CST
view 207
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 93
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 152
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 179
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
编程
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
2026-04-16 17:01:13 +0800 CST
view 279
TMom是一款基于.NET 8开源的多厂区多项目级MOM/MES系统,支持计划排程、工艺路线设计、在线低代码报表、大屏看板、移动端和AOT客户端,MIT协议开源。
MES
MOM
.NET
低代码
数字化看板
制造
开源
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 232
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 156
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
编程
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
2026-04-09 00:53:51 +0800 CST
view 627
2026年4月8日智谱发布GLM-5.1,744B参数MIT开源,SWE-bench Pro 58.4分超越Claude Opus 4.6,全球首个支持8小时长程自治的开源模型。
GLM-5.1
智谱AI
开源大模型
MoE
SWE-bench
长程自治
LLM
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 71
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 321
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
编程
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
2026-04-10 00:14:55 +0800 CST
view 284
深度解析 caveman 开源项目:一个让 Claude Code 用「穴居人语言」说话的 skill,砍掉 75% Token 消耗同时保持 100% 技术准确率。
Claude Code
Token优化
AI编程
Prompt Engineering
LLM效率
开源工具
程序员工具
代码审查
Vercel Claude Code 插件隐私丑闻深度解析:当部署助手变成了全项目监控软件
编程
Vercel Claude Code 插件隐私丑闻深度解析:当部署助手变成了全项目监控软件
2026-04-10 00:55:46 +0800 CST
view 252
深入解析Vercel Claude Code插件的隐私丑闻:从插件架构漏洞到三层遥测系统的代码级分析,以及用户自保指南
隐私安全
Claude Code
Vercel
插件生态
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
16
下一页