综合 Python 实现验证码识别：使用 Ddddocr 库

2024-11-18 18:38:02 +0800 CST views 2041

Python 实现验证码识别：使用 Ddddocr 库

前言

在自动化任务中，验证码识别是一项具有挑战性的任务。Ddddocr 是一个开源的 OCR 库，能帮助开发者处理各种验证码和图片中的文字识别。它基于 pytorch 和 onnxruntime，兼容性良好，能够处理中文、英文、数字以及特殊字符。

官方项目地址：ddddocr GitHub

安装方法

从 pypi 安装

可以通过 pip 安装 ddddocr 库：

pip install ddddocr

从源码安装

如果 pip 安装存在问题，可以从源码安装：

git clone https://github.com/sml2h3/ddddocr.git
cd ddddocr
python setup.py install

注意： 不要在ddddocr项目的根目录直接执行 import ddddocr，也不要将项目目录命名为 ddddocr，以避免模块冲突。

文件目录结构

项目基于 dddd_trainer 进行训练，使用 pytorch 作为训练框架，推理过程则依赖于 onnxruntime。

ddddocr
├── ddddocr/
│   ├── __init__.py
│   ├── common.onnx  # 新的OCR模型
│   ├── common_det.onnx  # 目标检测模型
│   ├── common_old.onnx  # 旧的OCR模型
├── README.md
├── setup.py

使用文档

基础 OCR 识别

ddddocr 主要用于识别图片中的文字，如验证码等。下面是一个简单的识别示例：

import ddddocr

# 初始化 OCR 对象
ocr = ddddocr.DdddOcr()

# 读取图片并进行OCR识别
image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

使用第二套模型

如果需要切换到第二套OCR模型：

ocr = ddddocr.DdddOcr(beta=True)

image = open("example.jpg", "rb").read()
result = ocr.classification(image)
print(result)

支持透明图片的识别

对于黑色透明的 png 图片，可以使用 png_fix 参数：

result = ocr.classification(image, png_fix=True)

提示： 避免在每次OCR识别时都重新初始化 ddddocr，因为初始化后的第一次识别速度较慢。建议只初始化一次。

目标检测功能

除了OCR识别外，ddddocr 还能检测图像中的目标区域（返回目标的边界框 bbox），特别适合用来检测图像中的主体物体。示例：

import ddddocr
import cv2

# 初始化对象，启用目标检测
det = ddddocr.DdddOcr(det=True)

# 读取图片并进行目标检测
image = open("21.png", 'rb').read()
bboxes = det.detection(image)
print(bboxes)  # 输出目标区域的坐标

# 使用 OpenCV 绘制检测结果
im = cv2.imread("21.png")
for bbox in bboxes:
    x1, y1, x2, y2 = bbox
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

# 保存结果图像
if im is not None and im.size != 0:
    cv2.imwrite("result.jpg", im)
else:
    print("Error: 处理后的图像是空的，无法保存。")

其他能力

ddddocr 还具备一些高级功能，比如：

滑块检测

ddddocr 提供了滑块检测功能，使用 opencv 实现，适用于处理滑块验证码的场景。

OCR 结果概率输出

ddddocr 支持返回识别结果的概率分布。通过 probability=True 参数，可以返回每个字符的识别概率：

result = ocr.classification(image, probability=True)

自定义 OCR 训练模型

开发者可以导入自定义训练的 OCR 模型，增强识别效果。

实际测试

可以从一些常见的验证码服务平台（如网易、腾讯的验证码服务）获取图片进行测试。ddddocr 在处理这类验证码时表现良好，能够成功识别大多数场景中的验证码内容。

总结

ddddocr 是一个功能强大且易于使用的 Python OCR 库，特别擅长处理验证码和单行文本的识别任务。它支持透明图片的处理、目标检测以及自定义模型导入。通过简单的初始化和调用，就能快速完成图片文字的识别和目标检测任务。

对于需要处理验证码或OCR识别的项目，ddddocr 无疑是一个理想的选择。

复制全文生成海报 Python OCR 图像处理机器学习开源

推荐文章

PHP爬虫利器：QueryList，让网页数据抓取变得简单高效

2025-09-02 10:11:37 +0800 CST

如何使用Rust和sqlx构建一个简单的用户管理系统，支持用户的增删改查功能，并实现操作日志记录。

2024-11-19 03:57:17 +0800 CST

mo.js是一个轻量级的JavaScript动画库，专注于创建流畅且表现力强的动画效果

2024-11-19 02:35:11 +0800 CST

驯服JavaScript中的this：从困惑到精通

2025-09-11 18:40:35 +0800 CST

nuxt.js服务端渲染框架

2024-11-17 18:20:42 +0800 CST

如何在Vue3中使用视频库Video.js实现视频播放？

2024-11-19 07:27:29 +0800 CST

三个让人直呼“Amazing”的 GitHub 开源项目，开发者效率神器来了！

2025-08-22 10:03:15 +0800 CST

git使用笔记

2024-11-18 18:17:44 +0800 CST

Vue中的样式绑定是如何实现的？

2024-11-18 10:52:14 +0800 CST

如何实现限制用户 1 分钟内最多请求 1000 次？

2024-11-18 22:06:10 +0800 CST

Go语言中的深拷贝：概念、实现与局限

2024-11-18 12:15:44 +0800 CST

在Go语言中，可以通过多种方式实现即插即用的插件系统

2024-11-19 09:40:51 +0800 CST

Vue3中如何使用计算属性？

2024-11-18 10:18:12 +0800 CST

Docker搭建一款跨平台的个人笔记服务

2024-11-19 08:51:04 +0800 CST

前端代码规范 - Commit 提交规范

2024-11-18 10:18:08 +0800 CST

使用PHP实现RSA算法生成数字的签名和验签

2024-11-17 05:02:38 +0800 CST

Kivy是一个开源的Python库，用于开发跨平台的图形用户界面（GUI）

2024-11-18 17:52:00 +0800 CST

Go语言中的nil切片、空切片和零切片的区别

2025-05-05 19:22:52 +0800 CST

Nginx 反向代理 Redis 服务

2024-11-19 09:41:21 +0800 CST

Vue3实现一个简单的待办事项列表，可以添加和删除事项

2024-11-18 01:36:26 +0800 CST

Golang Sync.Once 使用与原理

2024-11-17 03:53:42 +0800 CST

五个有趣且实用的Python实例

2024-11-19 07:32:35 +0800 CST

为什么 TailwindCSS 在开发者中如此受欢迎？揭秘背后的原因！

2024-11-18 14:28:47 +0800 CST

简易运维脚本，方便非专业运维人员批量操作多台Linux设备

2024-11-17 19:33:52 +0800 CST

底部导航栏

2024-11-19 01:12:32 +0800 CST

php指定版本安装php扩展

2024-11-19 04:10:55 +0800 CST

7 个你可能不知道的 CSS 新特性，彻底改变你的样式写法！

2025-07-07 17:45:39 +0800 CST

如何使用Vue Router实现动态路由匹配

2024-11-18 17:20:03 +0800 CST

如何在Vue3中使用组合API和ref创建一个响应式表单？

2024-11-19 07:04:42 +0800 CST

Vue 3 的 Composable 函数是什么？如何编写和使用它们？

2024-11-19 08:26:22 +0800 CST

介绍 Vue 3 中的新的 `emits` 选项

2024-11-17 04:45:50 +0800 CST

Vue3和Bootstrap创建一个响应式导航栏。通过结合Vue3的CompositionAPI和Bootstrap的样式，开发者可以快速构建美观且易于使用的导航组件

2024-11-19 03:33:21 +0800 CST

PHP使用无头浏览器如何帮助数据提取和抓取

2024-11-19 00:20:57 +0800 CST

Mysql允许外网访问详细流程

2024-11-17 05:03:26 +0800 CST

在 Go 语言中使用 Wire 进行依赖注入

2024-11-19 08:47:21 +0800 CST

Rust 使用 SQLite 构建安全高性能的数据持久化方案

2024-11-18 17:41:20 +0800 CST

Pendulum是一个强大的Python时间处理库

2024-11-19 08:46:46 +0800 CST

Vue3中的Teleport组件是用来做什么的？

2024-11-18 09:35:36 +0800 CST

HTMX：用HTML属性实现AJAX、CSS过渡和WebSockets

2024-11-18 22:44:08 +0800 CST

LLM驱动的强大网络爬虫工具

2024-11-19 07:37:07 +0800 CST

出海独立站个人收款，为什么我选 Creem？

2025-07-28 23:05:44 +0800 CST

pip安装到指定目录上

2024-11-17 16:17:25 +0800 CST

5种独特的图标导航设计，利用CSS和JavaScript提升用户体验

2024-11-19 10:04:42 +0800 CST

避免 Go 语言中的接口污染

2024-11-19 05:20:53 +0800 CST

如何在Vue 3中使用Ref访问DOM元素

2024-11-17 04:22:38 +0800 CST

如何用 PHP 写一个简易版的网站备份工具

2024-11-18 10:58:52 +0800 CST

如何在Vue3中实现一个简单的购物车功能，可以添加和移除商品

2024-11-18 14:03:25 +0800 CST

Predis是一个流行的PHPRedis客户端库，提供简单易用的API与Redis交互

2024-11-18 05:01:35 +0800 CST

ElasticSearch 结构

2024-11-18 10:05:24 +0800 CST

Vue3的自动化测试怎么做？详细说明一下常用的测试工具和框架

2024-11-19 06:25:54 +0800 CST