程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 55
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
最全面的 `history` 命令指南
代码
最全面的 `history` 命令指南
2024-11-18 21:32:45 +0800 CST
view 1625
本文全面介绍了Linux和Unix系统中的`history`命令,包括其基本用法和高级选项。用户可以通过该命令查看、清空和管理命令历史记录,使用不同选项如`-c`、`-d`、`-w`等来操作历史记录。此外,文中还讨论了如何通过环境变量设置来优化历史记录的管理和使用。
Linux
Unix
命令行
Shell
技术
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 34
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
编程
免费 + 100万上下文 + 内置搜索:Gemini CLI 凭什么挑战 Claude Code?
2026-05-11 12:52:32 +0800 CST
view 170
Google 开源 Gemini CLI,Apache 2.0 许可,完全免费,100万 token 上下文全部可用,内置 Google 搜索增强,支持 Skills/MCP/Hooks 系统,CI/CD 集成完整。本文深度对比与 Claude Code 的差异、实战场景和最佳实践。
Gemini CLI,Claude Code,AI编程工具,Google,100万token上下文,MCP协议,Skills系统,免费AI助手,终端编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 133
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
编程
Obsidian Agent Skills 深度解析:从知识库到自动化工作流的工程实践
2026-04-12 08:54:32 +0800 CST
view 387
深度解析 Obsidian Agent Skills 的工程架构:四层架构设计、Skill Registry 路由机制、与 MCP 的关系,以及如何从零构建 AI 辅助的论文写作工作流。
Obsidian
Agent Skills
知识管理
AI
自动化工作流
OpenClaw
MCP
Addy Osmani 的 Agent Skills 深度解析:给 AI 编程助手装上「工程纪律」——从 Prompt 工程到工作流编排的生产级实践
编程
Addy Osmani 的 Agent Skills 深度解析:给 AI 编程助手装上「工程纪律」——从 Prompt 工程到工作流编排的生产级实践
2026-05-17 13:15:28 +0800 CST
view 112
Google工程总监Addy Osmani开源的Agent Skills项目,通过20个生产级工程技能为AI编程助手注入工程纪律,让AI从「快手实习生」进化为「靠谱工程师」。本文深度解析其设计哲学、技术架构和实战应用。
AI编程
Agent Skills
Addy Osmani
工程纪律
工作流
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
编程
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
2026-05-24 06:38:48 +0800 CST
view 64
深度拆解 TradingAgents 多智能体交易框架的架构设计,从 LangGraph 状态图编排到结构化辩论机制,完整代码实战指南
AI Agent
量化交易
LangGraph
多智能体
LLM
Agent Skills 深度解析:27K Star 的谷歌开源紧箍咒,让 AI 按生产级标准写代码
编程
Agent Skills 深度解析:27K Star 的谷歌开源紧箍咒,让 AI 按生产级标准写代码
2026-05-02 17:01:28 +0800 CST
view 202
谷歌 Chrome 团队 Addy Osmani 开源的 Agent Skills,27K Star。它是一套生产级工程约束框架,通过六阶段流程、反合理化机制和渐进式信息披露,强制 AI 按生产级标准写代码。
Agent Skills
AI编程
谷歌
开源
工程规范
TDD
Code Review
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 517
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
Zig 0.14 深度实战:从 comptime 编译时元编程到跨平台 C 互操作——2026 年系统编程新锐的工程化完全指南
编程
Zig 0.14 深度实战:从 comptime 编译时元编程到跨平台 C 互操作——2026 年系统编程新锐的工程化完全指南
2026-05-24 08:35:12 +0800 CST
view 28
深入剖析 Zig 0.14 核心特性:comptime 编译时元编程、错误联合类型、分配器设计、泛型实现、C 互操作、交叉编译,以及与 Bun/Rust/Go 的对比分析,附完整代码实战。
Zig
系统编程
comptime
C互操作
LLVM
交叉编译
内存管理
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 217
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
编程
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
2026-05-02 19:05:49 +0800 CST
view 143
深入解析上海交通大学 River-LLM 框架:通过退出层与骨干层共享 KV 缓存,解决早期退出的缓存缺失难题,实现 1.71x-2.16x 推理加速,几乎不损失精度。
LLM
推理优化
KV缓存
早期退出
量化
上海交通大学
Kimi K2.6实测:Claude 1/6价格,原生多模态编码,能吃截图能迭代
编程
Kimi K2.6实测:Claude 1/6价格,原生多模态编码,能吃截图能迭代
2026-04-21 09:50:07 +0800 CST
view 434
Kimi K2.6 code preview实测:原生多模态+Tool Calling+Agent能力,价格为Claude 1/6,适合独立开发者做前端复刻和日常编码辅助
AI
LLM
Kimi
K2.6
模型实测
多模态
Agent
编程模型
独立开发
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
编程
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
2026-05-02 22:34:34 +0800 CST
view 171
微软开源VibeVoice深度技术拆解:双Tokenizer架构、LLM对话中枢、Next-Token扩散模型、7.5Hz超低帧率,90分钟多角色对话生成的全链路实战
VibeVoice
语音合成
TTS
扩散模型
LLM
微软开源
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
编程
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
2026-04-12 21:54:21 +0800 CST
view 396
深入解读 ICLR 2026 论文 LRT,揭示如何用轻量级推理网络将冗长的思维链压缩为隐式向量,实现推理效率数十倍提升
AI
LLM
推理优化
思维链
ICLR2026
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
编程
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
2026-05-17 19:18:49 +0800 CST
view 93
Google LangExtract库深度解析,介绍如何使用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 417
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
编程
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
2026-05-12 02:15:08 +0800 CST
view 138
深度解析React Compiler(React Forget)的工作原理:通过静态分析自动推导依赖关系、自动插入useMemo/useCallback记忆化代码、构建数据流图与活性分析算法、Babel插件实现细节、与手动优化性能对比,附Vite/Next.js集成指南与渐进式迁移策略
React,React Compiler,性能优化,自动记忆化,useMemo,useCallback,React.memo,Babel插件,静态分析,前端性能
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
编程
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
2026-05-17 19:30:29 +0800 CST
view 106
2026年最新Google LangExtract深度实战指南,全面解析如何用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
结构化数据
Karpathy 的 LLM Wiki 深度解析:当知识管理从「解释器」进化为「编译器」——一场关于复利效应的工程革命
编程
Karpathy 的 LLM Wiki 深度解析:当知识管理从「解释器」进化为「编译器」——一场关于复利效应的工程革命
2026-04-13 00:25:08 +0800 CST
view 571
Andrej Karpathy 的 LLM Wiki 方法论深度解析:从解释器模式到编译器模式的范式转移,复利效应的工程实现,三层架构设计,以及规模化挑战与实践路径。
LLM
知识管理
RAG
Karpathy
Obsidian
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
编程
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南(2026)
2026-05-24 13:30:29 +0800 CST
view 31
Google LangExtract 深度实战:从非结构化文本到结构化知识的工程化完全指南,涵盖架构分析、代码实战、性能优化。
LangExtract
LLM
结构化提取
Google
Python
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
编程
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
2026-04-21 13:55:15 +0800 CST
view 361
GitHub热榜AI视频项目!LMG2025大会获奖团队开源,输入主题自动生成完整短视频,含数字人口播、图生视频、动作迁移等功能。
Pixelle-Video
AI视频
开源
短视频
数字人
Agent Skills 深度解析:重塑 AI 协作范式——从开放标准到工程化落地的完整技术内幕
编程
Agent Skills 深度解析:重塑 AI 协作范式——从开放标准到工程化落地的完整技术内幕
2026-05-18 01:45:05 +0800 CST
view 263
2026年5月Agent Skills开放标准发布,将AI能力模块化封装为技能包。本文深入剖析架构设计、工作原理、工程实践与生态前景。
Agent Skills
AI工程
Claude
开放标准
技能编排
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
17
18
19
20
21
22
下一页