程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 427
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
Linux 7.0内核Rust转正实战:从零编写你的第一个Rust内核驱动程序
编程
Linux 7.0内核Rust转正实战:从零编写你的第一个Rust内核驱动程序
2026-04-25 03:31:43 +0800 CST
view 467
深度解析Linux 7.0内核Rust转正:从架构原理到环境搭建,从零编写完整的Rust字符设备驱动,涵盖内存安全模型、C互操作、性能优化和调试策略。
Rust
Linux内核
驱动开发
内核编程
Rust for Linux
MELT架构深度解析:高通如何让AI"深度思考"不再耗尽内存——循环Transformer的内存革命
编程
MELT架构深度解析:高通如何让AI"深度思考"不再耗尽内存——循环Transformer的内存革命
2026-05-19 13:46:15 +0800 CST
view 180
高通AI研究院提出的MELT架构通过门控机制让循环Transformer的内存消耗保持恒定,无论思考多少轮。本文深度解析其架构原理、数学推导、训练策略与性能实测。
AI
Transformer
内存优化
深度推理
高通
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
编程
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
2026-04-17 10:15:58 +0800 CST
view 433
2026年4月,MIT、英伟达、浙江大学联合发布TriAttention,用三角函数建模注意力距离偏好,实现KV缓存10.7倍压缩,让单卡4090跑出百万Token上下文。
AI
大模型
Transformer
注意力机制
KV缓存
长上下文
模型优化
论文解读
2026
Linux 7.1 内核深度解析:NTFS 驱动四年重构终成正果,40 年 i486 架构正式谢幕
编程
Linux 7.1 内核深度解析:NTFS 驱动四年重构终成正果,40 年 i486 架构正式谢幕
2026-04-27 15:22:09 +0800 CST
view 271
深度解析Linux 7.1内核两大里程碑:历时四年的全新NTFS驱动正式合入主线,实现原生读写、性能提升35%-110%;服役40年的i486架构正式退役。从技术架构到性能实测,全面剖析这场内核层面的新旧交替。
Linux
内核
NTFS
文件系统
i486
操作系统
性能优化
iomap
folio
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
编程
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
2026-04-08 16:35:10 +0800 CST
view 633
Google TimesFM 2.5 时间序列预测基础模型深度解析:200M参数零样本预测,16k上下文,Decoder-only Transformer架构,Patch分词,Monash基准测试击败监督模型
时间序列
机器学习
Google
Transformer
Goose 深度解析:从 Block 的 AI 编程助手到 Linux Foundation 的开源 Agent 平台
编程
Goose 深度解析:从 Block 的 AI 编程助手到 Linux Foundation 的开源 Agent 平台
2026-04-08 18:24:35 +0800 CST
view 919
深入解析从 Block 迁移至 Linux Foundation AAIF 的开源 AI Agent 项目 Goose:Rust 引擎、三位一体架构、70+MCP 扩展生态
AI Agent
Rust
MCP
Linux Foundation
Open Source
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
编程
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
2026-05-31 08:21:47 +0800 CST
view 169
Subquadratic发布的SubQ模型采用SSA亚二次稀疏注意力架构,实现1200万Token上下文窗口,在MRCR v2基准测试中碾压GPT-5.5。本文从架构原理、基准分析、代码实战到生产部署全面解读这场注意力革命。
SSA
Subquadratic
SubQ
Transformer
注意力机制
长上下文
RAG
稀疏注意力
AI架构
大模型
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 478
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
编程
MarkItDown 深度实战:微软开源文档转换工具终结 RAG 数据准备之痛——从 PDF 到 Markdown 的生产级完全指南(2026)
2026-06-10 17:46:59 +0800 CST
view 49
微软开源的 MarkItDown 工具如何解决 RAG 数据准备的核心痛点,深度解析 PDF、Word、Excel 等文档格式转换的生产级实践
MarkItDown
RAG
PDF
python
Microsoft
文档转换
Linux 7.0 内核深度解析:从 EEVDF 调度器到 XFS 自我修复——企业级操作系统的新纪元
编程
Linux 7.0 内核深度解析:从 EEVDF 调度器到 XFS 自我修复——企业级操作系统的新纪元
2026-04-19 15:15:44 +0800 CST
view 365
Linux 7.0 内核正式发布!深度解析 EEVDF 调度器、XFS 自我修复、Intel Shadow Stack 等核心新特性,附性能实测数据和生产环境调优指南。
Linux
Kernel
EEVDF
XFS
操作系统
系统内核
性能优化
文件系统
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 224
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
Linux 7.0 内核深度解析:从 TIP 时间片扩展到 EEVDF 调度器——Linus 亲自操刀的性能革命
编程
Linux 7.0 内核深度解析:从 TIP 时间片扩展到 EEVDF 调度器——Linus 亲自操刀的性能革命
2026-05-02 11:04:50 +0800 CST
view 270
Linux 7.0内核深度技术解析:EEVDF调度器取代CFS、TIP时间片扩展优化游戏性能、XFS自我修复、Atomic Writes存储加速、Sheaves内存管理、开放树命名空间容器启动飞跃、IO_uring零拷贝网络
Linux
内核
EEVDF
调度器
TIP
XFS
Atomic Writes
IO_uring
微软开源 MarkItDown:万能格式转换神器,15+ 格式统一转 Markdown,狂揽 140K+ Star!
编程
微软开源 MarkItDown:万能格式转换神器,15+ 格式统一转 Markdown,狂揽 140K+ Star!
2026-06-13 08:23:13 +0800 CST
view 14
MarkItDown是微软AutoGen团队开源的文件格式转换工具,GitHub 140K+ Stars,将15+种文件格式(PDF/Office/图片/音频/视频/HTML/YouTube)统一转成Markdown,专为LLM优化,支持OCR和Azure AI集成。
MarkItDown
微软开源
文件转换
Markdown
RAG
LLM
OCR
PDF
Office
知识库
DFlash 深度实战:基于块扩散的极速投机解码模型——2026年完全指南
编程
DFlash 深度实战:基于块扩散的极速投机解码模型——2026年完全指南
2026-05-25 03:31:37 +0800 CST
view 230
本文深入讲解DFlash的核心概念、架构设计、实战安装与集成,以及性能优化方法,帮助开发者全面掌握这一2026年热门的LLM推理速度优化工具。
DFlash
投机解码
LLM推理速度
开源项目
2026
4400人收藏!Kami:让AI生成的文档终于有了值得一看的排版
案例
4400人收藏!Kami:让AI生成的文档终于有了值得一看的排版
2026-05-06 07:10:59 +0800 CST
view 346
4400人收藏的Kami文档设计系统,8条设计铁律让AI生成文档有专业排版,6种文档类型,12种内置SVG图表,暖米色背景+油墨蓝强调色,Serif字体印刷质感
文档设计
AI排版
Kami
PDF生成
设计系统
Claude Skill
tw93
编程
MarkItDown 深度解析:微软如何用轻量级 Python 工具重新定义文档转换——从 PDF 到 Markdown 的工程革命
2026-04-15 07:53:17 +0800 CST
view 535
深度解析微软开源的 MarkItDown 工具——GitHub 10万+ Star 的文档转换利器,涵盖架构设计、核心转换器实现、插件系统、RAG管道集成和生产级优化策略。
Python
Markdown
PDF
微软
RAG
开源
Linux 7.0 内核深度解析:当版本号重置遇上实质进化——从 XFS 自愈到 Rust 稳态的工程革命
编程
Linux 7.0 内核深度解析:当版本号重置遇上实质进化——从 XFS 自愈到 Rust 稳态的工程革命
2026-04-15 16:21:53 +0800 CST
view 443
深度解析 Linux 7.0 内核的核心改进:XFS 自愈机制、ML-DSA 后量子签名、Rust 支持稳态化、EEVDF 调度器换代,以及硬件前瞻适配。
Linux
内核
XFS
Rust
EEVDF
安全
DFlash 深度实战:当扩散模型遇上推测解码——从原理到生产级 LLM 推理加速完全指南(2026)
编程
DFlash 深度实战:当扩散模型遇上推测解码——从原理到生产级 LLM 推理加速完全指南(2026)
2026-06-06 01:38:49 +0800 CST
view 148
DFlash(Block Diffusion for Flash Speculative Decoding)是ZLab于2026年提出的LLM推理加速框架,用块扩散模型替代传统自回归草稿模型,实现6倍以上无损加速。
LLM推理加速
推测解码
扩散模型
块扩散
DFlash
ZLab
大模型优化
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
编程
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
2026-04-16 19:04:26 +0800 CST
view 455
Docs2KG是AI4WA开源的知识图谱构建框架,用大模型将PDF、邮件、Excel等异构文档统一抽取为知识三元组,构建统一知识图谱,支持问答和推理分析。
知识图谱
AI
LLM
PDF
RAG
知识管理
开源
DuckDB 1.5 + Sirius:GPU加速嵌入式分析数据库的性能革命
编程
DuckDB 1.5 + Sirius:GPU加速嵌入式分析数据库的性能革命
2026-04-08 14:42:27 +0800 CST
view 675
深度解析DuckDB 1.5新特性与Sirius GPU加速扩展,涵盖ExtensionKit、ClickBench基准测试、性能优化与实战指南
DuckDB
Sirius
GPU
数据分析
NVIDIA
cuDF
DFlash 深度实战:块扩散投机解码革命——让 Qwen3-8B 推理速度暴增 6.17 倍的技术全景(2026 完全指南)
编程
DFlash 深度实战:块扩散投机解码革命——让 Qwen3-8B 推理速度暴增 6.17 倍的技术全景(2026 完全指南)
2026-05-30 20:43:16 +0800 CST
view 191
DFlash 通过将块扩散模型引入投机解码,实现6.17倍无损推理加速。本文从原理、架构、数学推导、代码实战到生产部署,全方位解析这项颠覆性技术。
AI
大模型推理
DFlash
投机解码
块扩散
Qwen3
性能优化
编程
MarkItDown 深度解析:微软开源的文档转换神器如何重塑 LLM 时代的知识处理流水线
2026-04-18 06:17:21 +0800 CST
view 352
深度解析微软开源的 MarkItDown 文档转换工具,从架构设计、源码实现到实战应用,揭秘它如何成为 LLM 时代知识处理的基础设施。
MarkItDown
微软开源
文档转换
LLM
RAG
Python工具
Markdown
PDF转换
2026前端启示录:Rust正在系统性颠覆整个JavaScript工具链——从Webpack到Rolldown、Rspack、Oxc的架构革命
编程
2026前端启示录:Rust正在系统性颠覆整个JavaScript工具链——从Webpack到Rolldown、Rspack、Oxc的架构革命
2026-05-09 11:15:12 +0800 CST
view 375
深度解析2026年Rust语言在前端工具链的全面崛起:Rolldown、Rspack、Oxc、SWC如何用50-100倍性能重写JavaScript工具链,以及前端开发者的迁移实战指南。
Rust
JavaScript
前端工具链
Rolldown
Oxc
Vite 6
构建优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
18
下一页