Scannen und Aufteilen von PDF-Dokumenten nach einem bestimmten darin enthaltenen Text

By Nishanth Asokan | Automatisierung

Scannen und Aufteilen von PDF-Dokumenten nach einem bestimmten darin enthaltenen Text

Heutzutage automatisieren wir eine Vielzahl von Dokumentenprozessen. Möchten Sie einen bestimmten Text in einer PDF-Datei erkennen? Möchten Sie diesen Text verwenden, um die Datei an den Seiten aufzuteilen, die den bestimmten Text enthalten? Möchten Sie die geteilten Dateien anhand des für die Aufteilung verwendeten Textes umbenennen? Nun, wir haben die perfekte Lösung für Sie.

Die PDF4me Workflows Aktion "Nach Text aufteilen " ist für alle diese Dokumentlogiken geeignet. Workflows konzentrieren sich darauf, die beste Automatisierungslösung für Ihre Dokumentenprozesse zu liefern. Die Aktion kann auch den Text in der Zwischenablage speichern, um die Dateien mit dem Text bei Bedarf umzubenennen, während sie gespeichert werden. Sehen wir uns nun anhand eines Beispiel-Workflows an, wie wir diese Aktion einrichten können.

Wie scannt und teilt man PDF-Dateien nach einem bestimmten Text?

In unserem folgenden Beispiel erstellen wir einen Workflow, um eine PDF-Datei anhand eines bestimmten Textes aufzuteilen und den Text zur Umbenennung der aufgeteilten Dateien zu verwenden.

Starten Sie zunächst das PDF4me Dashboard](/pdf4me-workflows/dashboard/).

  • Wählen Sie die Schaltfläche Workflow erstellen.
PDF4me Workflow-Schnittstelle erstellen

Fügen Sie einen Auslöser zum Starten Ihres Workflows hinzu

Fügen Sie einen Auslöser hinzu, um Ihre Automatisierung in Gang zu setzen.

  • Derzeit bieten Workflows 2 Auslöser - Dropbox und Google Drive. Lassen Sie uns z.B. einen Dropbox-Auslöser erstellen.

Konfigurieren Sie die Verbindung und wählen Sie den Ordner, in dem die Eingabedateien erwartet werden.

Dropbox-Trigger für Workflow

Um den genauen Ablauf zu testen, können Sie dieses PDF-Beispiel verwenden - Beispieldatei herunterladen

Hinzufügen der Aktion Nach Text trennen

Fügen Sie eine Aktion “Nach Text trennen” hinzu und konfigurieren Sie sie, um die Dateiseiten mit dem gewünschten Text zu trennen. Hier verwenden wir einen regulären Ausdruck, um den eindeutigen Text zu erkennen.

Seriennummer:(.*)```

Die Regex findet den Textwert, der mit “Serial#:” beginnt, und teilt ihn anhand der Bedingung auf.

Konfiguration der Aktion Nach Text aufteilen

Hinzufügen eines “For Each Documet”-Steuerelements

Da Split By Text mehrere Dokumente erzeugt, ist ein Für jedes Dokument-Steuerelement erforderlich, um die Ausgabedateien einzeln zu behandeln. Der Rest der Aktionen sollte in dieses Steuerelement aufgenommen werden.

Für jede Steuerung zur Kontrolle mehrerer Ausgänge

Hinzufügen einer Aktion zum Speichern

Die Ausgabedateien müssen in einem Cloud-Speicher gespeichert werden. In unserem Anwendungsfall konfigurieren wir eine Aktion Speichern in Dropbox. In der obigen Abbildung sehen Sie einen Ausdruck, mit dem Sie einen Text aus der Aktion “Split By Text” erhalten. Sie können den unten angegebenen regulären Ausdruck im Parameter “Output File Name” verwenden, um die Dateien umzubenennen.

$${file.pages[0].PageText}.pdf```

Nach Umbenennung in Dropbox speichern

Der Ausdruck übergibt den Text aus der Aktion Nach PDF aufteilen an den Parameter für den Ausgabedateinamen, so dass die Dateien auf der Grundlage des gelesenen Textes umbenannt werden.

Um Zugang zu Workflows zu erhalten, benötigen Sie ein PDF4me-Abonnement. Sie können sich sogar einen Tagespass besorgen und Workflows ausprobieren, um zu sehen, wie sie Ihnen helfen können, Ihre Dokumentenaufträge zu automatisieren.

Related Blog Posts