程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
doxmlparser是一个用于处理XML文件的Python库
综合
doxmlparser是一个用于处理XML文件的Python库
2024-11-18 21:40:21 +0800 CST
view 1679
doxmlparser是一个用于处理XML文件的Python库,提供简单易用的接口来解析、修改和操作XML数据。本文介绍了doxmlparser的安装、基本用法和高级用法,包括添加、修改和删除XML元素的示例代码。通过使用doxmlparser,用户可以高效地处理XML文件,提升工作效率。
编程
Python
XML处理
数据解析
软件开发
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
编程
Scrapling 深度实战:当爬虫学会「自适应进化」——从 StealthyFetcher 隐身引擎到自适应解析的生产级完全指南(2026)
2026-06-11 09:21:13 +0800 CST
view 216
Scrapling 是2026年GitHub最火的下一代Python爬虫框架,通过StealthyFetcher隐身引擎(JA3/JA4指纹伪装)和AdaptiveParser自适应解析,让Cloudflare通过率从5%提升到92%,网站改版不再导致爬虫报废。本文深度拆解架构设计、生产级实战代码、性能对比及分布式调度方案。
Scrapling
Python
爬虫
反爬虫
Cloudflare
StealthyFetcher
自适应解析
网页抓取
数据采集
relext是一个强大的Python库,用于处理正则表达式相关任务
综合
relext是一个强大的Python库,用于处理正则表达式相关任务
2024-11-19 09:50:03 +0800 CST
view 1487
relext是一个强大的Python库,用于处理正则表达式相关任务。本文介绍了relext的安装、基本用法和高级用法,包括编译正则表达式、匹配字符串、搜索文本、分组、查找所有匹配项和使用预定义字符集等功能。通过实际案例,如提取邮箱地址和替换文本,展示了relext在文本解析和数据分析中的应用。
Python
编程
正则表达式
数据处理
文本解析
magic-html是一个基于Python的高效HTML解析工具
编程
magic-html是一个基于Python的高效HTML解析工具
2024-11-18 12:15:14 +0800 CST
view 2681
magic-html是一个基于Python的高效HTML解析工具,旨在简化从HTML中提取内容的过程。它支持多种HTML元素的快速定位,能够处理不规范的HTML文档,适用于Web爬虫、数据清洗和自动化测试等场景。其直观的API设计使得开发者可以轻松集成和使用,提供了优异的精确度和召回率,尤其在处理复杂网页结构时表现突出。
HTML解析
数据处理
Python工具
开源项目
Web开发
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
编程
NVIDIA Vera Rubin AI 系统深度解析:当 GPU 巨人全面进军 Agent 时代——从 Vera CPU 到 RTX Spark、Isaac GROOT 的全栈技术指南(2026)
2026-06-10 11:17:06 +0800 CST
view 218
2026年6月1日英伟达发布Vera Rubin AI系统,专为Agent时代打造。本文深度解析Vera CPU全球首款AI Agent专用处理器、Rubin GPU动态稀疏注意力、NVLink 72片间互联、RTX Spark进军PC市场、Isaac GROOT人形机器人平台等核心技术,从程序员视角全面剖析这场计算架构革命。
NVIDIA
Vera Rubin
Agent AI
GTC 2026
AI系统
Isaac GROOT
RTX Spark
Nemotron
深度解析
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
编程
百度 Unlimited OCR 深度解析:R-SWA 如何把 KV Cache 从线性增长压成常数,端到端 OCR 的长文档革命
2026-06-29 19:45:14 +0800 CST
view 17
深度解析百度开源的 Unlimited OCR:R-SWA 如何把 KV Cache 从线性增长压成常数,解决长文档 OCR 的失忆问题,OmniDocBench v1.6 刷新 SOTA 93.92%
Unlimited OCR
百度
OCR
端到端
长文档
R-SWA
开源
深度学习
文档解析
Markdown
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
编程
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
2026-06-30 02:13:31 +0800 CST
view 16
百度Unlimited OCR技术深度解析:R-SWA机制如何把KV Cache压成常数,3B模型刷新长文档OCR王座
OCR
百度
深度学习
文档解析
R-SWA
Scrapling 深度解析:52K Star 自适应爬虫框架——从抗改版自适应解析到原生绕过 Cloudflare 的工程革命
编程
Scrapling 深度解析:52K Star 自适应爬虫框架——从抗改版自适应解析到原生绕过 Cloudflare 的工程革命
2026-06-30 04:12:59 +0800 CST
view 15
Scrapling 52K+ Star Python自适应爬虫框架深度解析:抗改版自适应解析、原生绕过Cloudflare、类Scrapy并发框架,附完整代码实战与性能对比。
Scrapling
Python
爬虫
Web Scraping
Cloudflare绕过
自适应解析
Camoufox
反反爬
CodeGraph 深度解析:给 AI 编程助手装上代码知识图谱——从 Tree-sitter 解析到 MCP 协议集成的工程革命
编程
CodeGraph 深度解析:给 AI 编程助手装上代码知识图谱——从 Tree-sitter 解析到 MCP 协议集成的工程革命
2026-06-30 05:13:55 +0800 CST
view 15
深度解析CodeGraph代码知识图谱引擎:Tree-sitter多语言解析、符号提取与关系建模、SQLite+FTS5图数据库设计、MCP协议集成、性能优化策略、生产级部署实践,附完整代码示例与架构分析。
CodeGraph
代码知识图谱
AI编程
Tree-sitter
MCP协议
SQLite
AST解析
HTML 解析器性能深度横评:从 Lexbor 的 SIMD 优化到 BeautifulSoup 的易用性权衡——2026 年爬虫基础设施选型指南
编程
HTML 解析器性能深度横评:从 Lexbor 的 SIMD 优化到 BeautifulSoup 的易用性权衡——2026 年爬虫基础设施选型指南
2026-06-30 07:15:57 +0800 CST
view 10
深度解析2026年主流HTML解析器性能差异:从Lexbor的SIMD指令集优化、Arena内存分配器到BeautifulSoup的设计权衡,附完整基准测试数据与生产级选型指南。
HTML解析器
性能优化
爬虫
Lexbor
BeautifulSoup
lxml
SIMD
Arena分配器
GitNexus 深度实战:当 AI Coding Agent 学会「看懂代码架构」——从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱的生产级完全指南(2026)
编程
GitNexus 深度实战:当 AI Coding Agent 学会「看懂代码架构」——从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱的生产级完全指南(2026)
2026-06-11 09:48:52 +0800 CST
view 228
GitNexus 深度实战:从 Tree-sitter 多语言 AST 解析到 MCP 协议暴露知识图谱,让 AI Coding Agent 学会看懂代码架构,彻底解决盲改问题。
GitNexus
代码知识图谱
Tree-sitter
MCP协议
AI Coding Agent
AST解析
TypeScript
Scrapling 深度实战:自适应智能爬虫框架完全指南——从动态渲染到全站并行的工程化实践(2026)
编程
Scrapling 深度实战:自适应智能爬虫框架完全指南——从动态渲染到全站并行的工程化实践(2026)
2026-06-02 19:16:20 +0800 CST
view 295
Scrapling 是2026年GitHub Trending的黑马项目,今日暴涨1468星。本文深度解析其自适应解析引擎、浏览器自动化集成、性能优化策略,并通过完整电商爬虫实战,带你掌握这一颠覆传统爬虫开发体验的新一代框架。
Python
爬虫
Scrapling
Web Scraping
自适应解析
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 457
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 356
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
编程
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
2026-06-17 09:52:23 +0800 CST
view 215
CodeGraph 是专为AI编码代理打造的本地代码知识图谱引擎,预索引代码库的符号关系和调用图,让AI直接查询结构化知识而非逐行扫描文件,Token消耗降低57%,响应速度提升46%的生产级完全指南
CodeGraph
AI编码代理
代码知识图谱
MCP
Tree-sitter
Claude Code
Cursor
AST解析
codebase-memory-mcp 深度实战:当AI编码代理终于理解了你的100万行代码库——从知识图谱构建到MCP协议集成的大规模工程化完全指南(2026)
编程
codebase-memory-mcp 深度实战:当AI编码代理终于理解了你的100万行代码库——从知识图谱构建到MCP协议集成的大规模工程化完全指南(2026)
2026-06-25 20:44:22 +0800 CST
view 83
深度解析codebase-memory-mcp的架构设计与实战部署,讲解如何通过代码知识图谱和MCP协议解决AI辅助开发的上下文不足问题,涵盖从原理到生产级部署的完整流程
codebase-memory-mcp
MCP协议
代码知识图谱
AI辅助开发
AI编码工具
Cursor
Claude Code
代码解析
知识图谱构建
工程化实践
Scrapling 深度实战:当 Python 爬虫学会"隐形"与"自愈"——从指纹伪装到自适应解析、反检测架构与生产级数据采集的完全指南(2026)
编程
Scrapling 深度实战:当 Python 爬虫学会"隐形"与"自愈"——从指纹伪装到自适应解析、反检测架构与生产级数据采集的完全指南(2026)
2026-06-18 07:26:30 +0800 CST
view 147
Scrapling 是下一代 Python 爬虫框架,天生隐形+自适应解析+统一API,零配置绕过Cloudflare/Datadome/Akamai,网站改版后自动重定位元素,一个框架覆盖静态/动态/反检测三种模式
Scrapling
Python
爬虫
反检测
自适应解析
Web Scraping
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
编程
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
2026-05-18 08:22:35 +0800 CST
view 486
全面解析 vLLM 推理引擎的核心架构,从 PagedAttention 原理到生产级部署实战,涵盖量化推理、多GPU并行、性能调优等完整技术栈
vLLM
LLM推理
PagedAttention
GPU优化
量化推理
深度解析
三行CSS实现惊艳像素化效果:揭秘Element-plus官网视觉魔法
编程
三行CSS实现惊艳像素化效果:揭秘Element-plus官网视觉魔法
2025-08-19 16:30:01 +0800 CST
view 1514
本文深入剖析了Element-plus官网的像素化效果,展示了如何用三行CSS代码实现复古像素风格。通过创建半透明像素网格遮罩层,结合径向渐变和模糊滤镜,用户可以轻松复现这一视觉效果。文章还提供了代码示例、参数调优指南及技术原理解析,强调了CSS在视觉设计中的强大能力。
CSS
前端开发
视觉设计
用户体验
技术解析
RAGFlow:81.1k Star开源RAG引擎,AI时代最强外脑
编程
RAGFlow:81.1k Star开源RAG引擎,AI时代最强外脑
2026-05-26 13:35:41 +0800 CST
view 291
RAGFlow是InfiniFlow团队(Milvus原班人马)开发的81.1k Star开源RAG引擎,专注解决文档解析问题,支持DeepDoc深度文档理解、可视化切片、Agentic RAG,可私有化部署。
RAG
开源
LLM
文档解析
AI应用
RAGFlow
InfiniFlow
Milvus
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 101
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
RAG-Anything 深度解析:从多模态文档解析到知识图谱构建,全链路实战指南
编程
RAG-Anything 深度解析:从多模态文档解析到知识图谱构建,全链路实战指南
2026-04-26 05:12:22 +0800 CST
view 588
深度解析RAG-Anything全模态RAG框架:从MinerU文档解析、四管线并行模态分析、到LightRAG知识图谱构建与双级检索,附完整代码实战与性能优化指南
RAG
多模态
知识图谱
LightRAG
MinerU
文档解析
Scrapling 深度实战:当爬虫学会了「自适应进化」——从智能元素追踪到 Cloudflare 绕过,Python 爬虫框架的生产级完全指南(2026)
编程
Scrapling 深度实战:当爬虫学会了「自适应进化」——从智能元素追踪到 Cloudflare 绕过,Python 爬虫框架的生产级完全指南(2026)
2026-06-15 03:17:56 +0800 CST
view 184
Scrapling 深度实战指南:揭秘自适应爬虫框架如何自动追踪页面改版、绕过 Cloudflare 反爬系统,从架构原理到生产级代码实战,2026 年 Python 爬虫技术全景。
Python
爬虫
Scrapling
Web Scraping
反爬
Cloudflare
自适应解析
开源项目
Kreuzberg:用Rust重塑文档智能,92种格式一键解析的RAG利器
编程
Kreuzberg:用Rust重塑文档智能,92种格式一键解析的RAG利器
2026-04-08 14:27:27 +0800 CST
view 641
Kreuzberg是一个用Rust编写的开源文档智能框架,支持92+文件格式和12种编程语言绑定,专为RAG应用设计。本文深度解析其架构设计、实战用法和性能优势。
Rust
RAG
文档解析
开源项目
AI基础设施
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
22
下一页