程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 418
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
编程
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
2026-06-02 22:14:57 +0800 CST
view 310
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 399
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 277
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 368
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
编程
Headroom 深度实战:当 Netflix 工程师用「上下文压缩」掀翻 AI 成本底牌——从 CCR 可逆机制到跨 Agent 记忆的生产级完全指南(2026)
2026-06-11 15:20:19 +0800 CST
view 335
Netflix工程师开源的AI上下文压缩工具Headroom,能在保持答案质量的前提下将Token消耗压缩60-95%,累计节省70万美元成本。本文深度剖析其架构设计、CCR可逆机制、跨Agent记忆共享与生产级集成实践。
AI编程
Token压缩
上下文管理
LLM优化
OpenSource
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
编程
OctaFuse Gateway:统一管理Coding Plan/Token Plan的开源AI网关,个人SaaS都能用
2026-06-22 21:00:01 +0800 CST
view 124
OctaFuse Gateway开源AI网关,把Provider、模型路由、API Key、用户、预算、用量审计、财务记账和管理后台放在一起。个人用可统一Coding Plan/Token Plan入口;做SaaS可变成LLM服务底座。支持OpenAI/Anthropic/Gemini多协议,Provider Key池统一调度多套额度,三层成本口径(metered/standard/charged),自带Admin后台+Playground+Simulator。
OctaFuse
AI网关
开源
LLM管理
多模型路由
SaaS
计费审计
Provider Key池
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 367
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 233
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
编程
CLEAR 深度实战:当浙大+腾讯+北大联手破解AI推理「算力浪费」难题——从理性放弃机制到生产级LLM推理优化完全指南(2026)
2026-06-12 14:20:52 +0800 CST
view 197
深度解析 ICML 2026 接收的 CLEAR 推理优化方法。浙江大学、腾讯、北京大学联合提出:对没有希望的问题理性放弃,把算力集中到能解决的问题上。包含完整 Python 实现、vLLM/SGLang 集成、生产级部署指南。
LLM
推理优化
ICML 2026
CLEAR
算力分配
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
编程
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
2026-04-21 05:47:35 +0800 CST
view 514
深度解析微软开源工具MarkItDown:如何将PDF、Word、Excel等20+格式转换为结构化Markdown,为LLM和RAG场景提供高质量的文档预处理方案。涵盖架构设计、实战代码、性能优化与生产部署最佳实践。
MarkItDown
文档转换
LLM
RAG
Python
开源工具
微软
Vera 编程语言深度解析:当一门语言从设计之初就为 LLM 而生
编程
Vera 编程语言深度解析:当一门语言从设计之初就为 LLM 而生
2026-06-17 16:27:35 +0800 CST
view 184
深度解析 Vera 编程语言——一门从设计之初就专为 LLM 编写的编程语言,涵盖强制合约验证、结构引用、效果类型系统、WebAssembly 编译等核心技术。
编程语言
AI编程
LLM
形式化验证
WebAssembly
Z3
万字深度解析:Andrej Karpathy 的 Vibe Coding 与 CLAUDE.md——70行配置文件如何重新定义AI辅助编程(2026)
编程
万字深度解析:Andrej Karpathy 的 Vibe Coding 与 CLAUDE.md——70行配置文件如何重新定义AI辅助编程(2026)
2026-07-01 00:43:10 +0800 CST
view 14
Andrej Karpathy的CLAUDE.md(70行6万Star)和Vibe Coding理念深度解析,四大核心原则、完整实战、工具集成与避坑指南,约12000字
VibeCoding
ClaudeMD
AI辅助编程
Karpathy
软件工程
LLM
代码生成
最佳实践
万字深度解析 Microsoft VibeVoice:当开源遇上前沿语音AI——从 TTS 到 ASR 的全栈语音合成与识别技术革命(2026)
编程
万字深度解析 Microsoft VibeVoice:当开源遇上前沿语音AI——从 TTS 到 ASR 的全栈语音合成与识别技术革命(2026)
2026-07-01 04:12:36 +0800 CST
view 16
2026年Microsoft Research开源VibeVoice,支持90分钟TTS连续生成、60分钟ASR单次处理。深度解析Next-Token Diffusion架构、7.5Hz超低频Tokenizer、多说话人建模与vLLM推理加速。
VibeVoice
Microsoft
TTS
ASR
语音AI
开源
Next-Token Diffusion
LLM
Diffusion
Understand Anything 深度实战:当知识图谱颠覆代码理解——从多智能体管道到可交互代码地图的完整指南(2026)
编程
Understand Anything 深度实战:当知识图谱颠覆代码理解——从多智能体管道到可交互代码地图的完整指南(2026)
2026-06-17 21:26:38 +0800 CST
view 251
Understand Anything 将任意代码库转化为交互式知识图谱,用多智能体管道解决代码理解难题。本文深度解析其架构设计与实战应用。
AI
LLM
代码分析
知识图谱
GitHub
Claude
多智能体
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 415
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
编程
River-LLM 深度解析:上交大如何让大模型推理速度翻倍,却几乎不损失精度
2026-05-02 19:05:49 +0800 CST
view 355
深入解析上海交通大学 River-LLM 框架:通过退出层与骨干层共享 KV 缓存,解决早期退出的缓存缺失难题,实现 1.71x-2.16x 推理加速,几乎不损失精度。
LLM
推理优化
KV缓存
早期退出
量化
上海交通大学
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
编程
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
2026-05-02 22:34:34 +0800 CST
view 370
微软开源VibeVoice深度技术拆解:双Tokenizer架构、LLM对话中枢、Next-Token扩散模型、7.5Hz超低帧率,90分钟多角色对话生成的全链路实战
VibeVoice
语音合成
TTS
扩散模型
LLM
微软开源
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
编程
LRT 隐式思维链深度解析:当 AI 学会「静默思考」,推理效率提升数十倍的工程革命
2026-04-12 21:54:21 +0800 CST
view 698
深入解读 ICLR 2026 论文 LRT,揭示如何用轻量级推理网络将冗长的思维链压缩为隐式向量,实现推理效率数十倍提升
AI
LLM
推理优化
思维链
ICLR2026
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
编程
Google LangExtract 深度解析:用LLM实现非结构化文本的精准结构化提取与可视化
2026-05-17 19:18:49 +0800 CST
view 339
Google LangExtract库深度解析,介绍如何使用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
编程
万字深度解析 Microsoft MarkItDown:当文档解析遇见 LLM 预处理——从 15 种格式支持到 RAG 生产级实战的完整指南(2026)
2026-07-01 08:46:35 +0800 CST
view 16
万字深度解析微软 MarkItDown:15种格式一键转Markdown,单月新增34K Star登顶GitHub飙星榜。涵盖技术架构、核心算法、代码实战、性能优化与生产部署完整指南。
MarkItDown
文档转换
Markdown
LLM
RAG
PDF
Word
OCR
微软
开源项目
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
编程
Google LangExtract 深度实战:LLM结构化信息提取的完整指南(2026版)
2026-05-17 19:30:29 +0800 CST
view 328
2026年最新Google LangExtract深度实战指南,全面解析如何用LLM从非结构化文本中精准提取结构化信息,包含精确源接地、交互式可视化、代码实战和性能优化。
LLM
信息提取
Google
Python
NLP
结构化数据
Karpathy 的 LLM Wiki 深度解析:当知识管理从「解释器」进化为「编译器」——一场关于复利效应的工程革命
编程
Karpathy 的 LLM Wiki 深度解析:当知识管理从「解释器」进化为「编译器」——一场关于复利效应的工程革命
2026-04-13 00:25:08 +0800 CST
view 851
Andrej Karpathy 的 LLM Wiki 方法论深度解析:从解释器模式到编译器模式的范式转移,复利效应的工程实现,三层架构设计,以及规模化挑战与实践路径。
LLM
知识管理
RAG
Karpathy
Obsidian
编程
MarkItDown 深度解析:微软如何用 118K Star 的 Python 工具重新定义文档转 Markdown 的工程范式
2026-05-04 01:26:09 +0800 CST
view 385
深度拆解微软开源的 118K Star 项目 MarkItDown
Python
Markdown
文档转换
RAG
LLM
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
50
下一页