PaddleOCR
github地址:https://github.com/PaddlePaddle/PaddleOCR
一个轻量的可以解析pdf和图像识别文字的ocr,支持100种语言
截至到今日,本文使用的懒人包版本为PP-OCRv5
官网演示效果

懒人包
目前也仅cpu可用
使用方式依旧是fastapi接口,里面有两个api
一个是返回json数据,一个是返回ocr标注图片

测试图片解析标注
左侧为带背景标注,右侧为空白背景标注
实际场景可以使用获取到的json数据,里面有识别的文字,置信度,和坐标等

使用方式
目前仍然是一键懒人包,使用falstapi网页api文档的方式使用
详情参考使用说明.txt

点击此处 网盘下载
Tips
目前仅cpu可用,速度较慢,后期酌情添加gpu懒人包