使用Power Automate对图像进行高级OCR
我们捕获大量的文件图像或带有文本的表面,以提取数据或供以后参考。将扫描的文件或图像转换为可进行文本搜索的PDF文件对其进一步处理非常重要。为了使PDF可搜索,最常用的技术是光学字符识别 - OCR。
PDF4me提供高质量的PDF OCR,可以产生最准确的文本识别之一。但当你有数以百计的扫描文件需要被识别时,唯一的解决办法就是自动化。PDF4me也有这方面的解决方案。
结合微软Power Apps的Power Automate,PDF4me可以将涉及平凡和耗时的文档工作的业务流程自动化。带有Power Automate的PDF4me将连接你的数据源、应用程序和服务,以轻松创建强大的工作流程,使文档工作自动化。
如何在Power Automate中使用OCR?
让我们看一个例子,我们可以用Power Automate中的PDF4me OCR动作将图像转换成PDF。假设我们在OneDrive中有一些文件图像或带有文本的图像,或者我们希望它们能到达一个特定的文件夹中。让我们把它们转换为PDF并执行OCR。
为OneDrive添加一个触发器
Power Automate有多种类型的触发器来启动你的工作流程。在这个用例中,添加一个OneDrive触发器来启动自动化。
为文件图像添加转换为PDF
完成触发器部分后,点击 “新步骤”。一个有许多应用程序建议的提示,你必须搜索PDF4me并选择PDF4me Connect。从行动列表中选择转换为PDF的行动。
选择使用OCR行动将PDF转换为可编辑的文件
从PDF4me行动中,列出选择PDF OCR。
**文件内容:**从源行动中输入文件内容
**文件名:**从源行动中输入文件内容
**质量类型:**选择质量类型。草稿或高
PDF4me推荐高质量档案的图像OCR,它确保即使从复杂的图像中也能准确识别。
将 "仅在需要时进行OCR "设置为true,这样该动作就不会对已经被识别的PDF执行OCR。从而,节省了调用成本。
保存OCR处理的文件
最后,在OCR动作之后添加一个动作,将输出的PDF文件存储到所需的存储器中。在这个例子中,我们再次使用OneDrive的保存动作。
你还可以使用在 "文件名 "字段中使用正则表达式(RegEx)来创建动态名称,以便更好地对处理过的文件进行分类。
使用PDF4me 开发者订阅,创建PDF OCR工作流程和更多令人敬畏的自动化,节省宝贵的时间,专注于最重要的事情。