Lesen von Text aus einem bestimmten Bereich einer PDF-Datei mit Workflows

By Vishnu Subramoniam | Automatisierung

Lesen von Text aus einem bestimmten Bereich einer PDF-Datei mit Workflows

Heutzutage automatisieren wir viele Dokumentenprozesse. Sie möchten Text aus einem bestimmten Bereich eines PDFs kopieren? Sie möchten diesen Text später bei der Bearbeitung des PDFs verwenden? Nun, wir haben die perfekte Lösung für Sie. Die PDF4me-Workflow-Aktionen decken alle diese Dokumentlogiken ab.

Workflows sind darauf ausgerichtet, die beste Automatisierungslösung für Ihre Dokumentenprozesse zu liefern. Die Aktion Text lesen von Workflows kann Text aus einem bestimmten Bereich eines PDF-Dokuments lesen und kopieren. Dieser Bereich kann in Pixeln definiert werden, die sich auf einen beliebigen Bereich in einem PDF-Dokument beziehen können.

Wie liest man Text aus einer PDF-Datei?

Betrachten wir dies anhand eines Beispiel-Workflows, bei dem Sie eine große PDF-Datei aufteilen und die Ausgabedateien mit einem bestimmten Text aus jeder der PDF-Dateien benennen möchten.

Starten Sie zunächst das PDF4me Dashboard](/pdf4me-workflows/dashboard/).

  • Wählen Sie die Schaltfläche Workflow erstellen.
PDF4me-Workflow erstellen

Fügen Sie einen Auslöser hinzu, um Ihren Workflow zu starten

Fügen Sie einen Auslöser hinzu, um Ihre Automatisierung in Gang zu setzen. Derzeit bieten Workflows 2 Auslöser.

Dropbox und Google Drive. Lassen Sie uns z. B. einen Dropbox-Trigger erstellen.

Konfigurieren Sie die Verbindung und wählen Sie den Ordner, in dem die Eingabedateien erwartet werden.

Dropbox-Trigger konfigurieren

Hinzufügen einer Split-Aktion

Fügen Sie eine Aktion “PDF teilen” hinzu und konfigurieren Sie sie, um die Seiten der Datei nach Bedarf zu trennen. Hier verwenden wir die Aktion “Wiederkehrend teilen”, um die Seiten regelmäßig nach einer bestimmten Anzahl von Seiten zu trennen.

Split-Aktion teilt PDF-Seiten wiederkehrend auf

Hinzufügen eines “For Each Documet”-Steuerelements

Da die **Aktion Split Recurring mehrere Dokumente erzeugt, ist ein Für jedes Dokument-Steuerelement erforderlich, um die Ausgabedateien einzeln zu behandeln. Der Rest der Aktionen sollte in dieses Steuerelement integriert werden.

Jede Dokumentenkontrolle kann Ausgabedateien individuell behandeln

Hinzufügen der Aktion Text aus PDF lesen

Fügen Sie die Aktion “Text lesen” hinzu und konfigurieren Sie sie mit allen erforderlichen Parametern.

  • X1 - X-Position auf der linken Seite
  • Y1 - Y-Position auf der linken Seite
  • X2 - X-Position auf der rechten Seite
  • Y2 - Y-Position auf der rechten Seite
Lesen von Text an einer bestimmten Stelle in PDF

Hinzufügen einer Aktion zum Speichern

Die Ausgabedateien müssen in einem Cloud-Speicher gespeichert werden. In unserem Anwendungsfall konfigurieren wir eine Aktion Speichern in Dropbox. In der obigen Abbildung sehen Sie einen Ausdruck, um einen Text aus der Aktion “Text lesen” zu erhalten. Sie können den unten angegebenen regulären Ausdruck in den Parameter Name der Ausgabedatei kopieren und einfügen

$${file.pages[0].PageText}.pdf```

Speichern Sie die Ausgabedateien in Dropbox, nachdem Sie sie mit dem gelesenen Text benannt haben

Der Ausdruck übergibt den Text vom angegebenen Speicherort der PDF-Datei an den Parameter für den Ausgabedateinamen, so dass die Dateien auf der Grundlage des gelesenen Textes umbenannt werden.

Endgültig gelesener Text aus PDF-Workflow-Zusammenfassung

Um Zugang zu Workflows zu erhalten, benötigen Sie ein PDF4me-Abonnement. Sie können sich sogar einen Tagespass besorgen und Workflows ausprobieren, um zu sehen, wie sie Ihnen helfen können, Ihre Dokumentenaufträge zu automatisieren.

Related Blog Posts