quick_reference_all 清理扫描件/OCR（光学字符识别）。

单击

或

拖放文件

选择要在 PDF 中检测的语言（列出的语言是目前检测到的）：

chi_sim

deu

eng

fra

por

OCR 模式

额外设置

渲染类型（高级）

请阅读此文档，了解如何将其用于其他语言和/或不在 docker 中使用。

https://docs.stirlingpdf.com/Advanced%20Configuration/OCR

OCR PDF - 文字识别转换

什么是PDF OCR？

PDF OCR（光学字符识别）将扫描的PDF文档或图像转换为可搜索、可编辑的文本。此技术识别图像中的文字并将其转换为数字文本，使扫描文档可以搜索和编辑。

主要功能

高精度识别

多语言支持 中文、英文等
高准确率 99%+文字识别
手写文字识别 支持手写内容
表格识别 保持表格结构

智能处理

自动倾斜校正 扫描偏差修正
噪点去除 图像质量优化
布局保持 原始格式保留
批量处理 多文件同时处理

如何进行PDF OCR

上传文档：选择扫描的PDF或图像文件
选择语言：设置识别语言
调整设置：配置识别精度和输出格式
开始识别：运行OCR处理
下载结果：获取可搜索的PDF文档

优势

文档数字化：将纸质文档转换为数字格式
内容可搜索：在文档中快速查找文本
编辑能力：修改和更新文档内容
存储效率：数字文档更易管理

常见使用案例

历史文档数字化：将旧文档转换为数字格式
法律文档处理：使合同和协议可搜索
学术研究：数字化研究资料和书籍
商业文档：处理发票、收据和报告
图书馆管理：数字化图书和期刊

非常适合图书管理员、研究人员、法律专业人员、学生以及任何需要处理扫描文档的人。