当前位置:首页 > python > 正文内容

识别验证码 SO EASY

关中浪子3年前 (2021-08-03)python1062
【腾讯云】2核2G4M云服务器新老同享99元/年,续费同价

在很久之前,分享过一次Python代码实现验证码识别的办法。

当时采用的是pillow+pytesseract,优点是免费,较为易用。但其识别精度一般,若想要更高要求的验证码识别,初学者就只能去选择使用百度API接口了。

但其实百度API接口和pytesseract其实都需要进行前期配置,对于初学者来说就不太友好了。

而且百度API必须要联网,对于某些机器不能联网的朋友而言,就得pass了

最近群里有位群友分享了一个新库,试用一下发现非常实用,特意今天分享给大家。

Github地址:https://github.com/sml2h3/ddddocr

该库名也是非常有趣 —— ddddocr(谐音带带弟弟OCR)

环境要求

python >= 3.8Windows/Linux/Macox..

可以通过以下命令安装

pip install ddddocr

参数说明

在网上随机寻找了一个验证码图片,使用这个库来实战一下。

来源:百度搜索

import ddddocrocr = ddddocr.DdddOcr()with open('1.png', 'rb') as f:    img_bytes = f.read()res = ocr.classification(img_bytes)print(res)

成功识别出来了验证码文字!

而且优点也非常明显:首先代码非常精简,对比前文提到的两种方法,不需要额外设置环境变量等等,5行代码即可轻松识别验证码图片。另一方面,我们使用魔法命令%%time也测试出来吗,这段代码识别速度非常快。

下面用更多的验证码图片继续测试:

我又找了6个验证码图片来测试,观察结果,发现这类简单的验证码基本可以进行快速识别。但也有部分结果有问题——字母大小写没有进行区分(比如第6张图片)。

总而言之,如果你需要进行验证码识别,且对精度要求不是过高。

那么,带带弟弟OCR(ddddocr)这个库是一个不错的选择~


找梯子最重要的就是稳定,这个已经上线三年了,一直稳定没有被封过,赶紧下载备用吧!

扫描二维码推送至手机访问。

版权声明:本文由码农翻生发布,如需转载请注明出处。

本文链接:https://lubojian.cn/post/42.html

分享给朋友:

相关文章

python脚本 自动刷金币(头条极速版抖音极速版) 逍遥模拟器

1:下载逍遥模拟器安装抖音极速版,并登录2:安装python33:下载adb 并配置到系统环境中:  在这里下载platform-tools.zip 解压到电脑中,将其中的  (链接: https://pan.baidu.com/...

基于python的网页自动化工具--DrissionPage

 概述DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能收发数据包,甚至能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大,内置无数人性化设计和便捷功能...

python爬取app数据_如何进行手机APP的数据爬取?

Python爬虫手机的步骤:1. 下载fiddler抓包工具2. 设置fiddler这里有两点需要说明一下。设置允许抓取HTTPS信息包操作很简单,打开下载好的fiddler,找到 Tools -> Options,然后再HTTPS的...

python 项目部署到 linux 服务器

python 项目部署到 linux 服务器

一、安装python1、登录:https://www.python.org/downloads/source/ 下载对应版本:例如:Python-3.6.5.tgz2、文件上传:将文件上传到Linux系统的某个目录下,根据自己情况上传,本例...

python  django框架     \venv\Scripts\activate.ps1,因为在此系统上禁止运行脚本

python django框架 \venv\Scripts\activate.ps1,因为在此系统上禁止运行脚本

2. 解决方式 首先打开windos 文件管理器切换到 项目目录,然后鼠标右键+shift,  右键菜单里面会出现一个【在此处打开 powershell】菜单选项  进入项目执行&...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。