程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 8
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 319
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
RAGFlow:81.1k Star开源RAG引擎,AI时代最强外脑
编程
RAGFlow:81.1k Star开源RAG引擎,AI时代最强外脑
2026-05-26 13:35:41 +0800 CST
view 271
RAGFlow是InfiniFlow团队(Milvus原班人马)开发的81.1k Star开源RAG引擎,专注解决文档解析问题,支持DeepDoc深度文档理解、可视化切片、Agentic RAG,可私有化部署。
RAG
开源
LLM
文档解析
AI应用
RAGFlow
InfiniFlow
Milvus
RAG-Anything 深度解析:从多模态文档解析到知识图谱构建,全链路实战指南
编程
RAG-Anything 深度解析:从多模态文档解析到知识图谱构建,全链路实战指南
2026-04-26 05:12:22 +0800 CST
view 570
深度解析RAG-Anything全模态RAG框架:从MinerU文档解析、四管线并行模态分析、到LightRAG知识图谱构建与双级检索,附完整代码实战与性能优化指南
RAG
多模态
知识图谱
LightRAG
MinerU
文档解析
Kreuzberg:用Rust重塑文档智能,92种格式一键解析的RAG利器
编程
Kreuzberg:用Rust重塑文档智能,92种格式一键解析的RAG利器
2026-04-08 14:27:27 +0800 CST
view 621
Kreuzberg是一个用Rust编写的开源文档智能框架,支持92+文件格式和12种编程语言绑定,专为RAG应用设计。本文深度解析其架构设计、实战用法和性能优势。
Rust
RAG
文档解析
开源项目
AI基础设施
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 407
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 490
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
编程
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
2026-06-10 11:17:06 +0800 CST
view 193
2026年6月1日英伟达发布Vera Rubin AI系统,专为Agent时代打造。本文深度解析Vera CPU全球首款AI Agent专用处理器、Rubin GPU动态稀疏注意力、NVLink 72片间互联、RTX Spark进军PC市场、Isaac GROOT人形机器人平台等核心技术,从程序员视角全面剖析这场计算架构革命。
NVIDIA
Vera Rubin
Agent AI
GTC 2026
AI系统
Isaac GROOT
RTX Spark
Nemotron
深度解析
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
编程
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
2026-06-11 09:21:13 +0800 CST
view 193
Scrapling 是2026年GitHub最火的下一代Python爬虫框架,通过StealthyFetcher隐身引擎(JA3/JA4指纹伪装)和AdaptiveParser自适应解析,让Cloudflare通过率从5%提升到92%,网站改版不再导致爬虫报废。本文深度拆解架构设计、生产级实战代码、性能对比及分布式调度方案。
Scrapling
Python
爬虫
反爬虫
Cloudflare
StealthyFetcher
自适应解析
网页抓取
数据采集
GitNexus 深度实战:当 AI Coding Agent 学会「看懂代码架构」——从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱的生产级完全指南(2026)
编程
GitNexus 深度实战:当 AI Coding Agent 学会「看懂代码架构」——从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱的生产级完全指南(2026)
2026-06-11 09:48:52 +0800 CST
view 198
GitNexus 深度实战:从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱,让 AI Coding Agent 学会看懂代码架构,彻底解决盲改问题。
GitNexus
代码知识图谱
Tree-sitter
MCP协议
AI Coding Agent
AST解析
TypeScript
Scrapling 深度实战:自适应智能爬虫框架完全指南——从动态渲染到全站并行的工程化实践(2026)
编程
Scrapling 深度实战:自适应智能爬虫框架完全指南——从动态渲染到全站并行的工程化实践(2026)
2026-06-02 19:16:20 +0800 CST
view 267
Scrapling 是2026年GitHub Trending的黑马项目,今日暴涨1468星。本文深度解析其自适应解析引擎、浏览器自动化集成、性能优化策略,并通过完整电商爬虫实战,带你掌握这一颠覆传统爬虫开发体验的新一代框架。
Python
爬虫
Scrapling
Web Scraping
自适应解析
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 394
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
编程
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
2026-06-17 09:52:23 +0800 CST
view 199
CodeGraph 是专为AI编码代理打造的本地代码知识图谱引擎,预索引代码库的符号关系和调用图,让AI直接查询结构化知识而非逐行扫描文件,Token消耗降低57%,响应速度提升46%的生产级完全指南
CodeGraph
AI编码代理
代码知识图谱
MCP
Tree-sitter
Claude Code
Cursor
AST解析
doxmlparser是一个用于处理XML文件的Python库
综合
doxmlparser是一个用于处理XML文件的Python库
2024-11-18 21:40:21 +0800 CST
view 1664
doxmlparser是一个用于处理XML文件的Python库,提供简单易用的接口来解析、修改和操作XML数据。本文介绍了doxmlparser的安装、基本用法和高级用法,包括添加、修改和删除XML元素的示例代码。通过使用doxmlparser,用户可以高效地处理XML文件,提升工作效率。
编程
Python
XML处理
数据解析
软件开发
relext是一个强大的Python库,用于处理正则表达式相关任务
综合
relext是一个强大的Python库,用于处理正则表达式相关任务
2024-11-19 09:50:03 +0800 CST
view 1474
relext是一个强大的Python库,用于处理正则表达式相关任务。本文介绍了relext的安装、基本用法和高级用法,包括编译正则表达式、匹配字符串、搜索文本、分组、查找所有匹配项和使用预定义字符集等功能。通过实际案例,如提取邮箱地址和替换文本,展示了relext在文本解析和数据分析中的应用。
Python
编程
正则表达式
数据处理
文本解析
codebase-memory-mcp 深度实战:当AI编码代理终于理解了你的100万行代码库——从知识图谱构建到MCP协议集成的大规模工程化完全指南(2026)
编程
codebase-memory-mcp 深度实战:当AI编码代理终于理解了你的100万行代码库——从知识图谱构建到MCP协议集成的大规模工程化完全指南(2026)
2026-06-25 20:44:22 +0800 CST
view 28
深度解析codebase-memory-mcp的架构设计与实战部署,讲解如何通过代码知识图谱和MCP协议解决AI辅助开发的上下文不足问题,涵盖从原理到生产级部署的完整流程
codebase-memory-mcp
MCP协议
代码知识图谱
AI辅助开发
AI编码工具
Cursor
Claude Code
代码解析
知识图谱构建
工程化实践
Scrapling 深度实战:当 Python 爬虫学会"隐形"与"自愈"——从指纹伪装到自适应解析、反检测架构与生产级数据采集的完全指南(2026)
编程
Scrapling 深度实战:当 Python 爬虫学会"隐形"与"自愈"——从指纹伪装到自适应解析、反检测架构与生产级数据采集的完全指南(2026)
2026-06-18 07:26:30 +0800 CST
view 127
Scrapling 是下一代 Python 爬虫框架,天生隐形+自适应解析+统一API,零配置绕过Cloudflare/Datadome/Akamai,网站改版后自动重定位元素,一个框架覆盖静态/动态/反检测三种模式
Scrapling
Python
爬虫
反检测
自适应解析
Web Scraping
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
编程
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
2026-05-18 08:22:35 +0800 CST
view 465
全面解析 vLLM 推理引擎的核心架构,从 PagedAttention 原理到生产级部署实战,涵盖量化推理、多GPU并行、性能调优等完整技术栈
vLLM
LLM推理
PagedAttention
GPU优化
量化推理
深度解析
三行CSS实现惊艳像素化效果:揭秘Element-plus官网视觉魔法
编程
三行CSS实现惊艳像素化效果:揭秘Element-plus官网视觉魔法
2025-08-19 16:30:01 +0800 CST
view 1494
本文深入剖析了Element-plus官网的像素化效果,展示了如何用三行CSS代码实现复古像素风格。通过创建半透明像素网格遮罩层,结合径向渐变和模糊滤镜,用户可以轻松复现这一视觉效果。文章还提供了代码示例、参数调优指南及技术原理解析,强调了CSS在视觉设计中的强大能力。
CSS
前端开发
视觉设计
用户体验
技术解析
magic-html是一个基于Python的高效HTML解析工具
编程
magic-html是一个基于Python的高效HTML解析工具
2024-11-18 12:15:14 +0800 CST
view 2672
magic-html是一个基于Python的高效HTML解析工具,旨在简化从HTML中提取内容的过程。它支持多种HTML元素的快速定位,能够处理不规范的HTML文档,适用于Web爬虫、数据清洗和自动化测试等场景。其直观的API设计使得开发者可以轻松集成和使用,提供了优异的精确度和召回率,尤其在处理复杂网页结构时表现突出。
HTML解析
数据处理
Python工具
开源项目
Web开发
Scrapling 深度实战:当爬虫学会了「自适应进化」——从智能元素追踪到 Cloudflare 绕过,Python 爬虫框架的生产级完全指南(2026)
编程
Scrapling 深度实战:当爬虫学会了「自适应进化」——从智能元素追踪到 Cloudflare 绕过,Python 爬虫框架的生产级完全指南(2026)
2026-06-15 03:17:56 +0800 CST
view 166
Scrapling 深度实战指南:揭秘自适应爬虫框架如何自动追踪页面改版、绕过 Cloudflare 反爬系统,从架构原理到生产级代码实战,2026 年 Python 爬虫技术全景。
Python
爬虫
Scrapling
Web Scraping
反爬
Cloudflare
自适应解析
开源项目
A2A 协议深度解析:当多 Agent 系统告别「战国时代」——从协议原理到生产级实战完全指南(2026)
编程
A2A 协议深度解析:当多 Agent 系统告别「战国时代」——从协议原理到生产级实战完全指南(2026)
2026-06-15 18:20:12 +0800 CST
view 226
深入解析 Google A2A(Agent-to-Agent)协议:五大设计原则、Agent Card、Task 生命周期、JSON-RPC 方法全景,与 MCP 协议对比,并附 Python 生产级实战代码。
A2A
Agent
多Agent
MCP
协议解析
JSON-RPC
GitNexus 深度实战:零服务端代码知识图谱——从 AST 解析到 AI 智能体集成的完整指南
编程
GitNexus 深度实战:零服务端代码知识图谱——从 AST 解析到 AI 智能体集成的完整指南
2026-05-22 05:56:45 +0800 CST
view 280
GitNexus 是一款零服务端代码智能引擎,通过将代码库转化为知识图谱,为 AI Agent 提供深度的代码上下文感知能力。本文深入解析其架构设计、技术实现和实际应用。
GitNexus
代码知识图谱
AI智能体
AST解析
TypeScript
GitNexus 实战指南:浏览器端代码知识图谱的架构设计与 AI 智能体集成
编程
GitNexus 实战指南:浏览器端代码知识图谱的架构设计与 AI 智能体集成
2026-05-22 05:57:11 +0800 CST
view 332
GitNexus 是一款零服务端代码智能引擎,通过将代码库转化为知识图谱,为 AI Agent 提供深度的代码上下文感知能力。本文深入解析其架构设计、技术实现和实际应用。
GitNexus
代码知识图谱
AI智能体
AST解析
TypeScript
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
下一页