程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
编程
百度 Unlimited OCR 深度解析:R-SWA 如何让长文档 OCR 从"逐页煎熬"走向"一次搞定"
2026-06-28 14:13:06 +0800 CST
view 13
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,如何将 KV Cache 从线性增长压到常数,使长文档 OCR 性能恒定不衰减。含完整架构分析、训练配方、性能基准和实战代码。
Unlimited OCR
R-SWA
OCR
端到端
百度
文档识别
KV Cache
MoE
DeepEncoder
长文档处理
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 49
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
编程
百度 Unlimited OCR 深度实战:30亿参数仅激活5亿、R-SWA注意力革命——长文档OCR端到端SOTA完全指南(2026)
2026-06-28 06:43:54 +0800 CST
view 17
百度2026年6月开源Unlimited OCR:30亿参数仅激活5亿,R-SWA注意力把KV Cache压成常数,一次前向推理处理几十页文档,OmniDocBench v1.6得分93.92%刷新SOTA。
百度 Unlimited OCR
OCR
R-SWA
长文档
端到端
MoE
SGLang
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 507
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 423
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 463
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
编程
微软开源文档转换神器 MarkItDown:58K+ Star 的 Markdown 工具,支持 MCP 协议
2025-06-05 23:01:13 +0800 CST
view 1592
MarkItDown是微软开源的文档转换工具,支持多种文件格式(如PDF、Office、图片、音频等)转换为结构化的Markdown文档,适用于AI大模型和文本分析。该工具在GitHub上获得了超过58K的Star,提供了命令行和PythonAPI使用方式,并支持MarkdownConversionProtocol(MCP)。尽管在处理复杂格式时可能存在限制,但其多格式支持使其成为开发者的有力工具。
开源工具
文档处理
人工智能
文本分析
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 584
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
Vue3 vue-office 插件实现 Word 预览
编程
Vue3 vue-office 插件实现 Word 预览
2024-11-19 02:19:34 +0800 CST
view 2301
本文介绍了如何在Vue3项目中使用vue-office插件实现Word文档的预览功能。通过创建Vue3项目、安装vue-office插件、设置响应式数据、使用组件以及实现文件上传预览,用户可以方便地展示Word文档。代码示例详细展示了每个步骤的实现方式。
前端开发
Vue
文档处理
MarkItDown 深度拆解:微软如何用 Python 重新定义文档转换——从 89K Star 到 RAG 时代的「通用语」
编程
MarkItDown 深度拆解:微软如何用 Python 重新定义文档转换——从 89K Star 到 RAG 时代的「通用语」
2026-05-02 08:32:32 +0800 CST
view 343
微软AutoGen团队开源的markitdown工具深度解析,支持20+格式一键转Markdown,专为LLM/RAG场景优化,详解PDF/DOCX/PPTX转换原理与插件开发。
Python
AI
RAG
文档处理
开源
微软
mymark是一个强大的Python库,用于处理Markdown文件
综合
mymark是一个强大的Python库,用于处理Markdown文件
2024-11-18 03:27:27 +0800 CST
view 1633
mymark是一个强大的Python库,用于处理Markdown文件,支持将Markdown转换为HTML,并提供自定义解析器和插件系统。用户可以轻松安装和使用mymark来满足从简单到复杂的Markdown处理需求。本文介绍了mymark的基本用法、高级功能及实际应用案例,帮助用户快速上手并有效处理Markdown文件。
编程
Python库
文档处理
Markdown
python-docx是一个用于读取、创建和更新 Microsoft Word 2007+ (.docx) 文件的 Python 库。
综合
python-docx是一个用于读取、创建和更新 Microsoft Word 2007+ (.docx) 文件的 Python 库。
2024-11-18 23:01:50 +0800 CST
view 1395
python-docx是一个用于读取、创建和更新MicrosoftWord2007+(.docx)文件的Python库。它简化了Word文档的操作,支持创建、修改、格式设置、插入图像和表格等功能。适用于自动化报告生成、批量文档处理和动态合同生成等场景。本文介绍了该库的安装、特性和实际应用,帮助用户高效使用python-docx。
Python
文档处理
自动化
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
编程
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
2026-04-13 12:25:55 +0800 CST
view 829
微软开源的 MarkItDown 如何统一 PDF、Word、Excel、PPT 等格式转换为 Markdown,成为 RAG 数据预处理的事实标准。
RAG
Python
文档处理
Markdown
微软
OpenAI
LLM
MarkItDown 深度实战:从文档格式地狱到 LLM 数据管线的工程化完全指南(2026)
编程
MarkItDown 深度实战:从文档格式地狱到 LLM 数据管线的工程化完全指南(2026)
2026-06-04 19:15:39 +0800 CST
view 203
微软 MarkItDown 12.6万 Star 开源工具深度指南:从架构原理到生产级部署,解决文档预处理的最后一公里问题
MarkItDown
Python
文档处理
RAG
LLM
开源工具
编程
Web 端 DOCX 预览终极方案:docx-preview 与 mammoth 深度对比
2025-08-19 16:27:08 +0800 CST
view 1743
本文深入探讨了两种前端DOCX处理工具:docx-preview和mammoth。docx-preview提供像素级样式还原,适合需要精确预览的场景;而mammoth专注于内容提取,生成语义化HTML,适合轻量级应用。通过对比两者的特性、适用场景及性能优化技巧,帮助开发者选择合适的解决方案。
文档处理
前端开发
Web技术
MarkItDown深度解析:微软开源的AI文档预处理神器,10万星背后的技术架构与工程实践
编程
MarkItDown深度解析:微软开源的AI文档预处理神器,10万星背后的技术架构与工程实践
2026-04-23 05:40:30 +0800 CST
view 614
深度解析微软开源的MarkItDown文档预处理工具:从架构设计到工程实践,涵盖PDF/Word/Excel/图片/音频等20+格式转换、OCR与LLM Vision集成、RAG管道构建、Docker部署与性能优化
MarkItDown
微软
开源
Markdown
RAG
文档处理
AI
LLM
Python
MCP
MarkItDown 深度实战:微软开源的 89K Star 文档转 Markdown 利器——从架构设计到 MCP 集成的全链路解析
编程
MarkItDown 深度实战:微软开源的 89K Star 文档转 Markdown 利器——从架构设计到 MCP 集成的全链路解析
2026-05-06 09:34:00 +0800 CST
view 441
深度解析微软开源的 MarkItDown 文档转换工具,涵盖架构设计、实战应用、MCP 集成、性能优化与企业知识库构建全链路。
Python
开源
文档处理
MCP
AI
微软 MarkItDown 深度实战:12.6万 Star 的文档转 Markdown 神器——从架构设计到生产级 RAG 数据管线的完全指南(2026)
编程
微软 MarkItDown 深度实战:12.6万 Star 的文档转 Markdown 神器——从架构设计到生产级 RAG 数据管线的完全指南(2026)
2026-06-09 09:46:49 +0800 CST
view 259
深度解析微软 MarkItDown 12.6万 Star 的文档转换神器:从架构设计、插件系统到生产级 RAG 数据管线的完整实战指南。
MarkItDown,Python,微软,RAG,文档处理,AI,Markdown
编程
MarkItDown 深度实战:当微软用Python重写文档预处理——从转换器链到LLM集成的生产级完全指南(2026)
2026-06-12 13:48:19 +0800 CST
view 207
深度剖析微软开源的MarkItDown工具,详解其转换器链架构、插件系统、LLM集成和大规模文档处理性能优化,提供15个完整代码示例和生产级部署方案。
MarkItDown
文档预处理
LLM
RAG
Python
微软
Go 1.25 slog全解析:结构化日志与多Handler实战指南
编程
Go 1.25 slog全解析:结构化日志与多Handler实战指南
2025-08-30 19:36:22 +0800 CST
view 978
本文深入解析Go1.25的slog包,介绍结构化日志的概念及其优势,展示如何使用slog构建企业级日志系统。涵盖基础用法、高级特性、自定义Handler及多Handler支持,提供生产环境最佳实践和性能优化建议,帮助开发者高效记录和管理日志。
Go语言
日志处理
软件开发
编程
技术文档
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
综合
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
2024-11-19 05:45:47 +0800 CST
view 2601
本文介绍如何在Mac系统上编译支持GLTransitions的FFmpeg,包括安装依赖库、下载源代码、修改代码和编译步骤。通过集成GLTransitions,用户可以在视频中添加炫酷的转场效果。文中详细描述了从源码编译GLEW和GLFW3的过程,以及如何配置和使用gltransition过滤器。
多媒体处理
视频编辑
开源软件
编程
技术文档
综合
markdown语法
2024-11-18 18:38:43 +0800 CST
view 3818
Markdown是一种轻量级标记语言,以纯文本形式编写文档并可转换为HTML格式。由AaronSwartz和JohnGruber设计,因其易读、易写、易更改而受到广泛使用。Markdown支持多种语法,如标题、段落、引用、代码块等,适用于多种平台和工具,越来越多的网站和应用程序支持Markdown,方便用户组织内容。
编程
文档
技术
工具
网络
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
编程
MarkItDown 深度实战:当文档转换遇见LLM友好格式——从多格式解析到MCP集成的生产级完全指南(2026)
2026-06-16 04:47:57 +0800 CST
view 170
深度实战微软开源神器MarkItDown:从多格式文档解析到LLM友好Markdown转换,涵盖RAG系统构建、MCP集成、批量处理优化、生产级API服务部署,10000字完整指南。
MarkItDown
文档转换
Markdown
RAG
LLM
MCP
AI Agent
Python
综合
Reader-LM: 将 HTML 转化为 Markdown 的革命性工具
2024-11-18 11:00:51 +0800 CST
view 2138
Reader-LM是由JinaAI推出的一个小型语言模型,专门用于将HTML转换为干净的Markdown格式。它具备智能内容提取、格式转换和多语言支持等功能,具有轻量级、高性能和长上下文支持的特点。使用简单,提供高性价比,适合处理长文本。用户可以通过HuggingFace模型库和GoogleColab体验其强大功能,并将在AzureMarketplace和AWSSageMaker上线。
工具
技术
编程
文档转换
人工智能
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
11
下一页