python提取图片文字

STEP1:安装pillow ,pillow-pil ,pytesseract

pip install pillow
pip install pillow-pil 
pip install pillow-pil

安装完后,可以用

pip list

查看是否安装成功。若是列表中有,则安装成功。

STEP2:安装Tesseract

 下载地址:Index of /tesseract

下载完成后双击.exe文件进行安装,语言包这个地方选一下(若是太慢,这个地方不选,后期再装语言包也可以),其他就直接下一步下一步就行,安装目录需要记住,后面添加环境变量需要用到

                

 安装完后添加环境变量,win + R 打开运行窗口,输入sysdm.cpl 或直接电脑属性->高级系统设置

或 

 

 查看是否安装成功:

运行窗口输入cmd执行tesseract -v

tesseract -v

 出现版本号信息说明安装成功

 

        

具体可参考Tesseract-OCR 下载安装和使用_半濠春水的博客-CSDN博客_tesseract-ocr下载

STEP3:python代码提取文字

   文件目录:

test.jpg文件内容

 python代码

from PIL import Image
import pytesseract

def demo():
	image = Image.open('images/test.jpg')
	# lang='chi_sim'是设置成中文识别
	text = pytesseract.image_to_string(image,lang='chi_sim')
	print(text)


if __name__ == "__main__":
	demo()


 执行python index.py

输出结果:

 

 

 

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2023年6月21日
下一篇 2023年6月21日

相关推荐