程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
tinygrad 深度解析:从零构建轻量级深度学习框架——比PyTorch更hackable,比JAX更简洁
编程
tinygrad 深度解析:从零构建轻量级深度学习框架——比PyTorch更hackable,比JAX更简洁
2026-05-01 09:05:59 +0800 CST
view 306
从Tensor抽象到IR编译全栈解析,tinygrad轻量级深度学习框架深度实战
tinygrad
深度学习
框架
PyTorch
JAX
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 267
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
案例
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
2026-05-01 15:33:28 +0800 CST
view 1068
GitHub 45K+ Star 的 CC Switch 是什么?详解这款大模型万能遥控器的核心功能、与 One API 的区别、以及如何配合 OpenClaw 使用。
CC Switch
AI工具
大模型
OpenClaw
Claude Code
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 317
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
PyCharm 2026.1 调试器架构大重构:debugpy 上位、PEP 669 原生支持、asyncio 调试不再崩溃——一次迟到五年的工程救赎
编程
PyCharm 2026.1 调试器架构大重构:debugpy 上位、PEP 669 原生支持、asyncio 调试不再崩溃——一次迟到五年的工程救赎
2026-04-12 06:24:24 +0800 CST
view 456
深入解析 PyCharm 2026.1 的调试器架构重构:debugpy 替代 sys.settrace、PEP 669 低影响监控 API、asyncio 全链路调试、Docker/云端统一调试方案、uv 远程解释器、AI 开放平台 ACP Registry 与 BYOK 战略,以及 Python 3.13 自由线程模式适配。
PyCharm
Python
debugpy
PEP 669
asyncio
IDE
调试器
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 322
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 277
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 458
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
编程
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
2026-06-12 20:20:27 +0800 CST
view 34
2026年3月,AI生成的论文登上了Nature。本文深度拆解The AI Scientist-v2系统,从Agentic Tree Search算法到端到端智能体架构,结合代码实战,完整讲解AI自主做科研的技术全貌。
AI科研
自动化科研
AI-Scientist
Agentic Tree Search
科研自动化
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 315
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 647
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 319
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
编程
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
2026-04-12 18:54:54 +0800 CST
view 370
Archon 是 GitHub 本周 16.7k 星的热门项目,首个开源 AI 编码 Harness 构建器。本文深度解析其设计理念、架构实现、核心特性,以及如何用 YAML 工作流让 AI 编程从玄学变科学。
AI编程
Archon
Claude Code
工作流引擎
编程工具
YAML
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 601
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
2026-05-04 16:23:37 +0800 CST
view 516
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台如何重塑多智能体协作
2026-05-04 16:23:56 +0800 CST
view 655
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
Archon 深度解析:AI 编程的「Harness 工程」革命——当编码智能体从「随缘执行」到「工业化交付」
编程
Archon 深度解析:AI 编程的「Harness 工程」革命——当编码智能体从「随缘执行」到「工业化交付」
2026-04-13 11:53:10 +0800 CST
view 782
Archon是2026年GitHub最火的开源项目之一,首个AI编程Harness构建器。本文深度解析其设计哲学、架构实现和工程实践。
AI编程
Archon
Harness Engineering
Claude Code
GitHub
开源项目
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
编程
WeChatFerry 聊天 MCP 工具:让 AI 直接操控微信
2026-05-12 12:18:09 +0800 CST
view 317
基于WeChatFerry的聊天MCP工具,通过标准MCP协议让AI编程工具直接操控微信:发消息、管群聊、查通讯录、接收转账。支持Claude Code/Codex/VSCode等客户端,Go语言开发,仅Windows。
WeChatFerry
MCP
微信
Claude Code
Codex
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
编程
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
2026-05-05 06:36:49 +0800 CST
view 306
深度拆解 Karpathy 的 autoresearch 项目:630 行代码如何实现 AI 自主研究循环,从 program.md 编程范式到 Muon 优化器,从 Git 驱动版本控制到多 Agent 协作的全链路实战
AutoResearch
Karpathy
AI自主研究
Muon优化器
LLM训练
编程
Flowise 完全指南:低代码可视化 AI Agent 构建平台——从架构原理到生产级部署(2026)
2026-06-05 03:42:39 +0800 CST
view 356
Flowise 完全指南:从架构原理到生产级部署。详解可视化AI Agent构建、RAG全流程、多智能体系统、性能优化与云服务部署。
Flowise
AI Agent
低代码
LangChain
RAG
多智能体
LangGraph 深度实战:从状态图到生产级 Agent 系统——用图结构重新定义 AI 工程边界
编程
LangGraph 深度实战:从状态图到生产级 Agent 系统——用图结构重新定义 AI 工程边界
2026-04-14 10:54:15 +0800 CST
view 587
深度解析 LangGraph 核心架构与实战用法:状态机、节点/边设计、Human-in-the-Loop、多 Agent 协作、生产级持久化部署,附代码审查 Agent 完整案例,5000字+实战长文。
LangGraph
AI Agent
Python
LangChain
多智能体
CC Switch:一个桌面应用统一管理你的多个CLI工具
编程
CC Switch:一个桌面应用统一管理你的多个CLI工具
2026-05-13 17:54:00 +0800 CST
view 262
CC Switch是基于Tauri 2构建的跨平台桌面应用,一个界面统一管理Claude Code/Codex/Gemini CLI/OpenCode/OpenClaw等AI编程CLI工具。50+供应商预设一键切换,MCP和Skills统一管理面板,云同步多设备配置。
CC Switch
AI编程
CLI管理
Tauri
MCP
AI短剧出海“一人内容变现”时代:5集短剧72小时赚50万美金
案例
AI短剧出海“一人内容变现”时代:5集短剧72小时赚50万美金
2026-05-05 19:09:46 +0800 CST
view 293
中国创作者在YourChannel平台用5集AI短剧72小时赚50万美金,90%分成比例,5万OPC创作者,AI短剧出海进入"一人公司"时代
AI短剧
内容变现
YourChannel
一人公司
OPC
短剧出海
跨境内容
OpenAI Codex 2026 全面深度实战:从安装到成为你的「AI 编程队友」
编程
OpenAI Codex 2026 全面深度实战:从安装到成为你的「AI 编程队友」
2026-05-26 15:39:03 +0800 CST
view 230
2026年5月OpenAI Codex迎来史上最大更新:CLI、移动端、Chrome插件全面上线。本文从零开始,全面解析Codex的核心用法,通过10个实战案例教你把它变成真正的「AI编程队友」。
OpenAI
Codex
AI编程
ChatGPT
GPT-5
AI Agent
自动化
开发工具
CLI
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
19
20
21
22
23
...
32
下一页