程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
tinygrad 深度解析:从零构建轻量级深度学习框架——比PyTorch更hackable,比JAX更简洁
编程
tinygrad 深度解析:从零构建轻量级深度学习框架——比PyTorch更hackable,比JAX更简洁
2026-05-01 09:05:59 +0800 CST
view 256
从Tensor抽象到IR编译全栈解析,tinygrad轻量级深度学习框架深度实战
tinygrad
深度学习
框架
PyTorch
JAX
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 198
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 184
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 271
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 879
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 290
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 612
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
编程
开源Chrome插件一键扒光网站设计:自动提取配色/字体/间距,生成AI可读的SKILL.md
2026-04-21 09:02:26 +0800 CST
view 322
design-md-chrome:Chrome插件一键提取网站设计规范(字体/配色/间距/阴影/动画),生成DESIGN.md或SKILL.md喂给Claude Code/Cursor复刻
开源
Chrome插件
设计工具
AI编程
前端
设计系统
Claude Code
Cursor
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 277
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
编程
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
2026-05-12 01:18:07 +0800 CST
view 255
深度解析OpenSSL4.0三大核心升级:ECH加密整个TLS握手消除SNI隐私泄露、ML-DSA-MU与RFC8998后量子国密混合算法套件实现量子安全、cSHAKE可定制哈希函数防止重放攻击,附完整C/Python/Go多语言迁移实战与ECH部署指南
OpenSSL,TLS,ECH,后量子密码学,ML-DSA-MU,RFC8998,SM2,SM3,SM4,cSHAKE,隐私保护,国密算法,迁移指南
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
编程
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
2026-04-13 02:56:20 +0800 CST
view 1033
深度解析Hermes Agent的工程实现:四层记忆架构(SQLite+FTS5)、技能自生成闭环、与OpenClaw的本质对比,以及这条「自我进化」路线对AI工具链未来的意义。
AI Agent
Hermes Agent
自我进化
记忆架构
Nous Research
技能系统
SQLite
机器学习
Hermes Agent 深度解析:开源自进化 AI 智能体的架构设计与工程实践
编程
Hermes Agent 深度解析:开源自进化 AI 智能体的架构设计与工程实践
2026-04-21 13:52:16 +0800 CST
view 334
深入剖析Hermes Agent的三层记忆系统与自进化闭环设计,探讨开源自进化AI智能体的架构原理与工程实践
AI Agent
Hermes Agent
Nous Research
自进化
记忆系统
Hermes Agent 深度解析:47K Star 的自进化 AI 智能体框架——从 GEPA 进化引擎到跨会话持久记忆的全链路技术实战
编程
Hermes Agent 深度解析:47K Star 的自进化 AI 智能体框架——从 GEPA 进化引擎到跨会话持久记忆的全链路技术实战
2026-05-03 22:57:07 +0800 CST
view 249
深度拆解 Hermes Agent 的六大技术支柱:GEPA 自我进化引擎、FTS5 持久记忆、技能自动学习、200+ 模型零锁定、15+ 平台网关、企业级安全体系,附完整部署教程与生产实践。
Hermes Agent
AI Agent
自进化
Nous Research
GEPA
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
2026-05-04 16:23:37 +0800 CST
view 477
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
2026-05-04 16:23:56 +0800 CST
view 613
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
向量数据库终极选型指南(2026版):Qdrant、Milvus、Pgvector、Chroma 深度对比与架构解析
编程
向量数据库终极选型指南(2026版):Qdrant、Milvus、Pgvector、Chroma 深度对比与架构解析
2026-05-18 05:44:15 +0800 CST
view 552
深度对比2026年最主流的四大向量数据库:Qdrant、Milvus、Pgvector、Chroma,从架构设计、索引算法、性能基准到生产实践,帮你做出不后悔的技术决策。
向量数据库
Qdrant
Milvus
Pgvector
Chroma
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
编程
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
2026-05-12 12:18:09 +0800 CST
view 256
基于WeChatFerry的聊天MCP工具,通过标准MCP协议让AI编程工具直接操控微信:发消息、管群聊、查通讯录、接收转账。支持Claude Code/Codex/VSCode等客户端,Go语言开发,仅Windows。
WeChatFerry
MCP
微信
Claude Code
Codex
Hermes Agent 深度解析:Nous Research 如何用「自进化闭环」重新定义 AI Agent 的工程边界
编程
Hermes Agent 深度解析:Nous Research 如何用「自进化闭环」重新定义 AI Agent 的工程边界
2026-04-13 17:26:10 +0800 CST
view 788
深度拆解 Nous Research 开源的 Hermes Agent,从三层记忆系统、自动技能生成、MCP 双向协议等核心机制,探讨自进化 AI Agent 的工程实践与未来方向。
AI Agent
Hermes Agent
Nous Research
自我进化
记忆系统
开源
ChatDev 2.0 深度解析:零代码多智能体平台如何用角色扮演重构软件工程全流程
编程
ChatDev 2.0 深度解析:零代码多智能体平台如何用角色扮演重构软件工程全流程
2026-05-05 05:35:54 +0800 CST
view 304
深度解析ChatDev 2.0的四层架构、DAG工作流、多智能体角色扮演机制,附待办事项应用完整实战代码。
ChatDev 2.0
多智能体
软件工程
零代码
AI
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
编程
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
2026-05-05 06:36:49 +0800 CST
view 247
深度拆解 Karpathy 的 autoresearch 项目:630 行代码如何实现 AI 自主研究循环,从 program.md 编程范式到 Muon 优化器,从 Git 驱动版本控制到多 Agent 协作的全链路实战
AutoResearch
Karpathy
AI自主研究
Muon优化器
LLM训练
MemPalace 深度解析:当古希腊"记忆宫殿"成为AI长期记忆的工程解法
编程
MemPalace 深度解析:当古希腊"记忆宫殿"成为AI长期记忆的工程解法
2026-04-13 22:25:59 +0800 CST
view 315
MemPalace是一款本地AI记忆系统,基于古希腊记忆宫殿原理构建Wing/Hall/Room三级结构,Raw verbatim模式在LongMemEval上达到96.6% R@5,无摘要零LLM调用。本文深度解析其架构设计、存储管线与MCP集成。
AI记忆系统
向量数据库
ChromaDB
MCP协议
MemPalace
Hermes Agent 深度实战:构建自我进化的AI代理框架——从零实现具备持续学习能力的下一代AI系统
编程
Hermes Agent 深度实战:构建自我进化的AI代理框架——从零实现具备持续学习能力的下一代AI系统
2026-05-25 03:52:28 +0800 CST
view 128
深入剖析 NousResearch 的 Hermes Agent 框架,探讨如何构建具备自我进化能力的 AI 代理系统,包括架构设计、经验记忆、反思引擎、模式提取等核心机制,并提供完整的部署实战和代码示例。
AI Agent
自我进化
持续学习
NousResearch
Hermes
Hermes Agent 深度解析:自进化 AI 代理框架的设计哲学与工程实践
编程
Hermes Agent 深度解析:自进化 AI 代理框架的设计哲学与工程实践
2026-04-23 12:09:35 +0800 CST
view 294
深度解析 Hermes Agent 的架构设计、三层能力体系、四阶段闭环学习机制,附部署实战与性能优化指南,约12000字。
AI Agent
Hermes
自我进化
Nous Research
持久记忆
技能系统
CC Switch:一个桌面应用统一管理你的多个CLI工具
编程
CC Switch:一个桌面应用统一管理你的多个CLI工具
2026-05-13 17:54:00 +0800 CST
view 223
CC Switch是基于Tauri 2构建的跨平台桌面应用,一个界面统一管理Claude Code/Codex/Gemini CLI/OpenCode/OpenClaw等AI编程CLI工具。50+供应商预设一键切换,MCP和Skills统一管理面板,云同步多设备配置。
CC Switch
AI编程
CLI管理
Tauri
MCP
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
9
10
11
12
13
...
36
下一页