程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
编程
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
2026-06-27 09:15:20 +0800 CST
view 10
百度开源 Unlimited OCR,5天 GitHub Star 破万。本文深度解析其核心创新 R-SWA(Reference Sliding Window Attention),如何将解码器 KV Cache 从线性增长压成常数,OmniDocBench v1.6 刷榜 SOTA(93.92%),30B 总参/5B 激活,32K 超长上下文,一次前向全稿转录,附完整代码实战。
Unlimited OCR
R-SWA
KV Cache
MoE
端到端 OCR
百度
深度学习
Transformer
文档识别
OCR
首个开源AI网页游戏生成框架 OpenGame:一句话生成一款可玩的游戏!
资讯
首个开源AI网页游戏生成框架 OpenGame:一句话生成一款可玩的游戏!
2026-04-23 16:23:58 +0800 CST
view 451
OpenGame是首个开源的端到端网页游戏智能生成框架,由开发者leigest519创建。它通过GameSkill(模板技能和调试技能)解决跨文件不一致、场景连接断裂等游戏生成难题,支持贪吃蛇、塔防、RPG等2D游戏。驱动模型GameCoder-27B专为游戏引擎设计,经持续预训练、监督微调和强化学习训练。OpenGame-Bench评估游戏可玩性。用户只需一句话即可生成完整网页游戏,支持本地运行和API配置。
AI生成游戏
开源项目
游戏开发
代码智能体
网页游戏
端到端框架
HTTPSMS:用Android手机做SMS网关,HTTP API收发短信+端到端加密
编程
HTTPSMS:用Android手机做SMS网关,HTTP API收发短信+端到端加密
2026-06-21 07:21:58 +0800 CST
view 93
HTTPSMS 是开源短信网关服务,用 Android 手机做 SMS 网关,通过 HTTP API 收发短信。支持 AES-256 端到端加密、速率控制、Webhook 推送、Docker 自托管,提供 6+ 语言 SDK。
SMS
网关
Android
开源
Go
Kotlin
HTTP API
自托管
端到端加密
2FA
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
编程
Docker 27「Orion」深度解析:原生 AI 调度时代来临——GPU 拓扑感知、NUMA 绑定与容器化大模型部署新范式
2026-05-10 00:41:20 +0800 CST
view 325
Docker 27 Orion深度解析:GPU拓扑感知调度与PCIe/NVLink自动绑定、NUMA内存带宽限制、dockerd-scheduler AI调度代理、docker ai run零配置LLM部署、Dockerfile.ai模型封装语法、OOM Killer五步防御、cgroups v2集成与生产环境避坑指南
Docker
容器化
GPU调度
NUMA
AI推理
LLM
docker-compose
cgroups
Dockerfile
NVIDIA
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
编程
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
2026-05-13 22:15:56 +0800 CST
view 288
GLM-OCR是智谱AI推出的0.9B参数文档理解多模态模型,凭借布局感知两阶段流水线和GRPO强化学习,在OmniDocBench v1.5以94.62分领先。本文深度解析其CogViT架构、MTP解码加速、印章识别技术及完整部署实战。
GLM-OCR,智谱AI,OCR,多模态模型,文档理解
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
编程
百度 Unlimited OCR 深度实战:告别「越生成越慢」,一次性解析整本书的 OCR 革命
2026-06-27 02:13:37 +0800 CST
view 18
深度解析百度2026年6月开源的Unlimited OCR模型,介绍其R-SWA机制如何解决长文档OCR的KV cache线性增长问题,包含完整实战代码和性能优化技巧。
Unlimited OCR
百度
OCR
深度学习
MoE
R-SWA
长文档解析
PaddleOCR深度解析:登顶GitHub全球OCR王座,500万参数如何击败十亿参数视觉大模型
编程
PaddleOCR深度解析:登顶GitHub全球OCR王座,500万参数如何击败十亿参数视觉大模型
2026-04-18 08:16:02 +0800 CST
view 362
深入解析百度PaddleOCR登顶GitHub全球OCR项目Star第一的技术密码,剖析PP-OCRv5仅500万参数媲美十亿参数视觉大模型的工程奥秘
OCR
PaddleOCR
深度学习
百度
开源
TypeScript 巫师的 21 个 Claude 技能:当 AI 编程从"氛围"走向"工程"
编程
TypeScript 巫师的 21 个 Claude 技能:当 AI 编程从"氛围"走向"工程"
2026-05-06 11:34:54 +0800 CST
view 599
深度解析 Matt Pocock 开源的 21 个 Claude Code Agent Skills,涵盖 TDD、PRD 生成、Git 安全守护等核心技能,探索「知识资产结构化共享」的 AI 原生工程范式。
TypeScript
Claude Code
AI编程
Agent Skills
Matt Pocock
Matt Pocock Skills 深度实战:TypeScript 大神把 .claude 目录开源了——21个工程级 Agent Skills 从对抗氛围编码到生产级 AI 编程实践
编程
Matt Pocock Skills 深度实战:TypeScript 大神把 .claude 目录开源了——21个工程级 Agent Skills 从对抗氛围编码到生产级 AI 编程实践
2026-05-08 13:37:57 +0800 CST
view 626
深入解析 mattpocock/skills 项目:37K+ Star 的工程级 Agent Skills 集合,从需求对齐、TDD 测试驱动到架构守护,提供完整的长文实战指南。
AI编程
Claude Code
Agent Skills
TypeScript
mattpocock
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
2026-06-12 14:46:44 +0800 CST
view 322
深入解析苹果官方开源的 macOS 容器工具 apple/container,从架构设计、Virtualization.framework 技术栈、轻量VM模型等维度完整讲解,附实战部署示例。
Swift
Container
macOS
虚拟化
Apple Silicon
OCI
Docker
Go工业物联网实时数据监控平台:Kafka+WebSocket+Go协程,1000+设备毫秒级可视化
编程
Go工业物联网实时数据监控平台:Kafka+WebSocket+Go协程,1000+设备毫秒级可视化
2026-06-23 09:19:44 +0800 CST
view 80
simplied-iot-monitoring-go:Go企业级工业物联网实时监控系统。Kafka生产者模拟1000+设备数据,Go协程并发处理,30秒窗口聚合,Gorilla WebSocket毫秒级推送前端ECharts可视化。延迟<100ms,支持Prometheus+Grafana监控,完整Docker/K8s部署方案。
Go
工业IoT
Kafka
WebSocket
实时监控
ECharts
Prometheus
Grafana
Docker
Kubernetes
Apple Container深度实战:Swift写的Linux容器运行时,在Mac上跑容器的范式革命
编程
Apple Container深度实战:Swift写的Linux容器运行时,在Mac上跑容器的范式革命
2026-06-26 12:17:35 +0800 CST
view 18
Apple官方开源!用Swift在Mac上运行Linux容器的新范式。深度解析apple/container项目架构、隔离模型、实战操作,与Docker Desktop/Lima全面对比,12000字深度长文。
Apple
Container
Linux容器
macOS
Swift
Apple Silicon
容器化
Docker
OCI
Virtualization框架
Apple Container 深度实战:当苹果用 Swift 重写容器运行时——从轻量 VM 架构到 macOS 原生 Linux 容器的完全指南(2026)
编程
Apple Container 深度实战:当苹果用 Swift 重写容器运行时——从轻量 VM 架构到 macOS 原生 Linux 容器的完全指南(2026)
2026-06-14 10:15:55 +0800 CST
view 340
Apple 用 Swift 打造的 Linux 容器运行时深度解析——从每容器一 VM 的安全架构到 macOS Virtualization Framework 深度集成,涵盖安装配置、镜像构建、多容器编排、安全分析与性能优化
Apple
Swift
容器
macOS
Virtualization
Apple Silicon
Docker
OCI
苹果 container 深度实战:41K Star 的原生容器工具,Apple Silicon 上的 Linux 容器新范式
编程
苹果 container 深度实战:41K Star 的原生容器工具,Apple Silicon 上的 Linux 容器新范式
2026-06-27 09:45:33 +0800 CST
view 11
苹果开源41K Star的Linux容器工具apple/container,深度解析per-container VM架构、Containerization Swift包、Virtualization.framework集成、多架构镜像构建与生产部署实战。
container
Apple Silicon
Swift
OCI
容器化
Docker
macOS
Virtualization framework
开源
多架构
容器运行时战争 2026:Docker 被架空的真相——从 Containerd、Podman 到 Nix 的深度实战与选型指南
编程
容器运行时战争 2026:Docker 被架空的真相——从 Containerd、Podman 到 Nix 的深度实战与选型指南
2026-05-29 07:08:01 +0800 CST
view 334
2026年容器运行时深度对比:Docker被架空的真相,Containerd、Podman、Nix、CRI-O全链路实战,含架构分析、性能测试、安全对比与生产级选型决策树
Docker
Containerd
Podman
Nix
容器运行时
Kubernetes
云原生
OCI
Apple Container 深度实战:当 Swift 遇上 Linux 容器——从轻量级 VM 隔离到 Rosetta 跨架构构建的生产级完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇上 Linux 容器——从轻量级 VM 隔离到 Rosetta 跨架构构建的生产级完全指南(2026)
2026-06-15 07:22:31 +0800 CST
view 201
Apple Container 开源项目深度实战:每容器一 VM 的架构设计、Swift 技术栈解析、Rosetta 2 跨架构构建、vminitd 初始化系统、0.4.1 新特性 Container Machine,以及从安装到生产部署的完整指南
Apple Container
Swift
Linux容器
虚拟化
Rosetta
macOS
OCI
Docker替代
GLM-5 Turbo实战:10分钟从零生成影视系统,一键部署到NAS
案例
GLM-5 Turbo实战:10分钟从零生成影视系统,一键部署到NAS
2026-05-09 06:35:12 +0800 CST
view 416
GLM-5 Turbo实战:用AutoClaw 10分钟从零生成完整影视管理系统,Flask+SQLite+Bootstrap,Docker一键部署到飞牛NAS。PinchBench+ClawBench双榜国产第一,代码质量直接可用
GLM-5 Turbo
AutoClaw
AI编程
Docker
NAS
影视管理
智谱
Bun SIMD 深度实战:当 JavaScript 运行时拥抱 CPU 向量指令——从 Buffer.indexOf 2倍提速到 CRC32 20倍飞跃的生产级完全指南(2026)
编程
Bun SIMD 深度实战:当 JavaScript 运行时拥抱 CPU 向量指令——从 Buffer.indexOf 2倍提速到 CRC32 20倍飞跃的生产级完全指南(2026)
2026-06-08 18:28:13 +0800 CST
view 258
Bun 2026 SIMD深度实战:从Buffer.indexOf 2倍提速到CRC32 20倍飞跃,Mimalloc v3多线程内存分配,FastStringifier JSON加速,生产级迁移指南
Bun
SIMD
JavaScript
性能优化
AVX2
CRC32
Mimalloc
MarkItDown深度解析:微软开源10万星文档转Markdown神器,RAG知识库的终极数据入口
编程
MarkItDown深度解析:微软开源10万星文档转Markdown神器,RAG知识库的终极数据入口
2026-04-19 00:15:20 +0800 CST
view 521
微软AutoGen团队开源的MarkItDown,支持20+格式一键转Markdown,内置OCR和语音转写,专为LLM/RAG/知识库设计。10万星项目的深度技术解析,包含架构设计、代码实战、性能优化全攻略。
MarkItDown
微软
开源
RAG
文档转换
OCR
Python
PDD:一个基于 Go 的全链路自动化派单管理系统,截图 OCR 识别 + 企微派单 + 四方分润
案例
PDD:一个基于 Go 的全链路自动化派单管理系统,截图 OCR 识别 + 企微派单 + 四方分润
2026-05-10 09:51:59 +0800 CST
view 298
基于 Go + Gin 的全链路自动化派单管理系统,支持 AI OCR 截图识别、企微深度集成(自动建群/消息通知)、四角色权限体系、四方分润引擎(平台/设计师/谈单客服/跟单客服)。技术栈:React19管理端 + Wails桌面客户端 + WebSocket实时推送 + JWT+设备指纹安全。
Go
Gin
派单系统
企微
AI OCR
四方分润
React
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 405
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
编程
MonkeyOCR:国产开源OCR新星,结构化识别更高效
2025-07-22 18:09:30 +0800 CST
view 1493
MonkeyOCR是一款国产开源OCR工具,专注于高效的结构化识别,支持中英文复杂排版。其核心架构SRR三元组范式通过检测文档结构、进行高精度识别和推理结构关系,显著提升了识别准确率和速度。支持多种文档类型和应用场景,提供Docker一键部署和在线Demo体验,适合金融、科研和开发者使用。
OCR
开源软件
文档自动化
人工智能
技术工具
Python 实现验证码识别:使用 Ddddocr 库
综合
Python 实现验证码识别:使用 Ddddocr 库
2024-11-18 18:38:02 +0800 CST
view 2564
本文介绍了`ddddocr`库的使用,该库是一个基于`pytorch`和`onnxruntime`的开源OCR工具,专注于验证码和图片文字识别。提供了安装方法、基本使用示例、目标检测功能以及高级特性,如滑块检测和自定义模型导入。通过简单的代码示例,开发者可以快速实现OCR识别和目标检测,适合处理各种验证码场景。
Python
OCR
图像处理
机器学习
开源
CRI-O 深度解析:Kubernetes 轻量级容器运行时的生产级实践——从架构设计到性能优化的完整技术指南
编程
CRI-O 深度解析:Kubernetes 轻量级容器运行时的生产级实践——从架构设计到性能优化的完整技术指南
2026-05-17 20:17:43 +0800 CST
view 275
深度解析 CRI-O 轻量级容器运行时的架构设计、生产部署、性能优化与最佳实践
Kubernetes
CRI-O
容器运行时
云原生
Docker
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
26
下一页