Leggere il testo da un'area specifica di un PDF con i flussi di lavoro

By Vishnu Subramoniam | Automazione

Leggere il testo da un'area specifica di un PDF con i flussi di lavoro

Oggi automatizziamo molti processi documentali. Volete copiare del testo da un’area specifica di un PDF? Volete utilizzare quel testo in una fase successiva dell’elaborazione del PDF? Abbiamo la soluzione perfetta per voi. Le azioni di PDF4me Workflows rispondono a tutte queste logiche documentali.

I flussi di lavoro si concentrano in modo esclusivo sulla fornitura della migliore soluzione di automazione per i processi documentali. L’azione Leggi testo di Workflows può leggere e copiare il testo da un’area specifica di un documento PDF. Quest’area può essere definita in pixel, che possono riferirsi a qualsiasi area all’interno di un PDF.

Come leggere il testo da un PDF?

Vediamo questo aspetto creando un flusso di lavoro di esempio in cui si desidera dividere un file PDF di grandi dimensioni e nominare i file di output con un testo specifico da ciascuno dei PDF.

Iniziare lanciando la PDF4me Dashboard.

  • Selezionare il pulsante Crea flusso di lavoro.
Creare il flusso di lavoro PDF4me

Aggiungere un trigger per avviare il flusso di lavoro

Aggiungere un trigger per avviare l’automazione. Attualmente, i flussi di lavoro forniscono 2 trigger.

Dropbox e Google Drive. Ad esempio, creiamo un trigger Dropbox.

Configurare la connessione e scegliere la cartella in cui sono attesi i file di input.

Configurare l'attivazione di Dropbox

Aggiungere un’azione Split

Aggiungete e configurate un’azione Split PDF per separare le pagine del file come richiesto. In questo caso utilizziamo l’azione Split ricorrente per dividere le pagine periodicamente dopo un certo numero di pagine.

Azione di divisione delle pagine PDF in modo ricorrente

Aggiungere un controllo For Each Documet

Poiché l’azione Split Recurring genera più documenti, è necessario un controllo For Each Document per gestire i file di output uno per uno. Il resto delle azioni deve essere incluso in questo controllo.

Ogni controllo dei documenti deve gestire i file di output individualmente.

Aggiungere l’azione Leggi testo da PDF

Aggiungere e configurare l’azione Read Text con tutti i parametri richiesti.

  • X1 - Posizione X sul lato sinistro
  • Y1 - Posizione Y sul lato sinistro
  • X2 - Posizione X sul lato destro
  • Y2 - Posizione Y sul lato destro
Leggere il testo da una posizione specificata in PDF

Aggiungere un Salva all’azione

I file di output devono essere salvati su cloud storage. Nel nostro caso d’uso, configuriamo un’azione Save to Dropbox. Nell’immagine precedente, si può vedere un’espressione per ottenere un testo dall’azione ‘Read text’. È possibile copiare-incollare la stessa espressione regolare di seguito riportata nel parametro Nome file di output

``${file.pages[0].PageText}.pdf```

Salvate i file di output in dropbox dopo averli nominati con il testo letto.

L’espressione passerà il testo dalla posizione specificata del PDF e lo passerà al parametro del nome del file di output in modo che i file vengano rinominati in base al testo letto.

Riepilogo del flusso di lavoro finale di lettura del testo da PDF

Per ottenere l’accesso a Workflows è necessario un PDF4me Subscription. È anche possibile ottenere un Daypass e provare Workflows per vedere come può aiutare ad automatizzare i lavori sui documenti.

Related Blog Posts