使用Power Automate对图像进行高级OCR

By Nishanth Asokan | 文件自动化

使用Power Automate对图像进行高级OCR

我们捕获大量的文件图像或带有文本的表面,以提取数据或供以后参考。将扫描的文件或图像转换为可进行文本搜索的PDF文件对其进一步处理非常重要。为了使PDF可搜索,最常用的技术是光学字符识别 - OCR。

PDF4me提供高质量的PDF OCR,可以产生最准确的文本识别之一。但当你有数以百计的扫描文件需要被识别时,唯一的解决办法就是自动化。PDF4me也有这方面的解决方案。

结合微软Power Apps的Power Automate,PDF4me可以将涉及平凡和耗时的文档工作的业务流程自动化。带有Power Automate的PDF4me将连接你的数据源、应用程序和服务,以轻松创建强大的工作流程,使文档工作自动化。

如何在Power Automate中使用OCR?

让我们看一个例子,我们可以用Power Automate中的PDF4me OCR动作将图像转换成PDF。假设我们在OneDrive中有一些文件图像或带有文本的图像,或者我们希望它们能到达一个特定的文件夹中。让我们把它们转换为PDF并执行OCR。

使用Power Automate进行高级PDF OCR的流程

你可以在网上试试图片转PDFPDF OCR工具,看看转换的质量。

为OneDrive添加一个触发器

Power Automate有多种类型的触发器来启动你的工作流程。在这个用例中,添加一个OneDrive触发器来启动自动化。

谷歌驱动器触发OCR流程

为文件图像添加转换为PDF

完成触发器部分后,点击 “新步骤”。一个有许多应用程序建议的提示,你必须搜索PDF4me并选择PDF4me Connect。从行动列表中选择转换为PDF的行动

转换为PDF的动作,用于将图像转换为PDF

选择使用OCR行动将PDF转换为可编辑的文件

从PDF4me行动中,列出选择PDF OCR

**文件内容:**从源行动中输入文件内容
**文件名:**从源行动中输入文件内容
**质量类型:**选择质量类型。草稿或高

PDF4me推荐质量档案的图像OCR,它确保即使从复杂的图像中也能准确识别。

来自PDF4me的PDF OCR行动

将 "仅在需要时进行OCR "设置为true,这样该动作就不会对已经被识别的PDF执行OCR。从而,节省了调用成本。

保存OCR处理的文件

最后,在OCR动作之后添加一个动作,将输出的PDF文件存储到所需的存储器中。在这个例子中,我们再次使用OneDrive的保存动作。

保存OCR处理过的PDF到Onedrive的行动

你还可以使用在 "文件名 "字段中使用正则表达式(RegEx)来创建动态名称,以便更好地对处理过的文件进行分类。

Power automate中使用RegEx的动态文件名

可供OCR使用的现成模板

为了让你快速入门,我们准备了一些模板供你开始使用。

使用PDF4me 开发者订阅,创建PDF OCR工作流程和更多令人敬畏的自动化,节省宝贵的时间,专注于最重要的事情。

Related Blog Posts