OCR 代码 Python:图像文本识别与提取108


光学字符识别 (OCR) 是一种计算机技术,用于将图像中的文本提取为机器可读格式。OCR 代码在许多应用程序中至关重要,例如文档数字化、自动数据输入和图像分析。

Python 语言提供了丰富的 OCR 库,使您可以轻松地将其集成到您的项目中。本文将介绍使用 Python 进行 OCR 的一些最流行库,并详细说明如何使用它们。

1. Pytesseract

Pytesseract 是一个开源 OCR 库,使用 Tesseract 识别引擎。Tesseract 是谷歌开发的一个久经考验且功能强大的 OCR 引擎,使其成为处理各种图像类别的绝佳选择。

要使用 Pytesseract,请使用 pip 安装:pip install pytesseract

以下是使用 Pytesseract 进行 OCR 的示例代码:```python
import pytesseract
from PIL import Image
# 打开图像
image = ('')
# 使用 Pytesseract 提取文本
text = pytesseract.image_to_string(image)
# 打印提取的文本
print(text)
```

2. OpenCV

OpenCV 是一个计算机视觉库,包含用于图像处理、计算机视觉和机器学习的各种函数。OpenCV 提供了用于 OCR 的高级 OCR 模块,称为 Tesseract-OCR。

要使用 OpenCV 的 Tesseract-OCR,请使用 pip 安装:pip install opencv-python

以下是使用 OpenCV 进行 OCR 的示例代码:```python
import cv2
# 打开图像
image = ('')
# 转换为灰度并应用 Otsu 阈值
gray = (image, cv2.COLOR_BGR2GRAY)
thresh = (gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# 使用 Tesseract-OCR 提取文本
text = (thresh, None, False, 2)[0]
# 打印提取的文本
print(text)
```

3. EasyOCR

EasyOCR 是一个轻量级且易于使用的 OCR 库,专门用于 OCR 任务。它提供了与 Pytesseract 和 OpenCV 类似的功能,但使用 更简单的 API。

要使用 EasyOCR,请使用 pip 安装:pip install easyocr

以下是使用 EasyOCR 进行 OCR 的示例代码:```python
import easyocr
# 读取图像
reader = (['en'])
result = ('')
# 提取文本
text = ''.join([line[1] for line in result])
# 打印提取的文本
print(text)
```

OCR 代码在 Python 中的使用为图像文本识别和提取提供了有效的方法。使用本文介绍的库,您可以轻松地将 OCR 功能集成到您的应用程序中,从而自动化任务、提高准确性并从图像中提取有价值的信息。

2024-10-25


上一篇:Python 操作本地文件:全面指南

下一篇:Python中的文件操作:open()函数指南