Lire le texte d'une zone spécifique d'un PDF avec les workflows

By Vishnu Subramoniam | Automatisation

Lire le texte d'une zone spécifique d'un PDF avec les workflows

De nos jours, nous automatisons un grand nombre de processus documentaires. Vous voulez copier du texte à partir d’une zone spécifique d’un PDF ? Vous voulez utiliser ce texte à un stade ultérieur du traitement du PDF ? Eh bien, nous avons la solution parfaite pour vous. Les actions PDF4me Workflows répondent à toutes ces logiques de documents.

Workflows se concentre uniquement sur la fourniture de la meilleure solution d’automatisation pour vos processus documentaires. L’action Lire le texte de Workflows peut lire et copier le texte d’une zone spécifique d’un document PDF. Cette zone peut être définie en pixels, ce qui peut faire référence à n’importe quelle zone à l’intérieur d’un PDF.

Comment lire le texte d’un PDF ?

Voyons cela en créant un exemple de flux de travail dans lequel vous voulez diviser un grand fichier PDF et nommer les fichiers de sortie avec un texte spécifique de chacun des PDF.

Commencez par lancer le PDF4me Dashboard.

  • Sélectionnez le bouton Créer un flux de travail.
Créer un flux de travail PDF4me

Ajoutez un déclencheur pour lancer votre flux de travail

Ajoutez un déclencheur pour lancer votre automatisation. Actuellement, les flux de travail fournissent 2 déclencheurs.

Dropbox et Google Drive. Par exemple, créons un déclencheur Dropbox.

Configurez la connexion et choisissez le dossier où les fichiers d’entrée sont attendus.

Configurer le déclencheur Dropbox

Ajouter une action Split

Ajoutez et configurez une action Split PDF pour séparer les pages du fichier selon les besoins. Ici, nous utilisons l’action Split recurring pour séparer les pages périodiquement après un certain nombre de pages.

Division des pages PDF par action récurrente

Ajouter un contrôle pour chaque Documet

Puisque l’action Split Recurring génère plusieurs documents, un contrôle For Each Document est nécessaire pour traiter les fichiers de sortie un par un. Le reste des actions doit être inclus dans ce contrôle.

Permettre à chaque contrôle de document de traiter les fichiers de sortie individuellement.

Ajouter l’action Lire le texte du PDF

Ajoutez et configurez l’action Lire le texte avec tous les paramètres requis.

  • X1 - Position X sur le côté gauche
  • Y1 - Position Y sur le côté gauche
  • X2 - Position X sur le côté droit
  • Y2 - Position Y sur le côté droit
Lire le texte d'un emplacement spécifié dans un PDF

Ajout d’une action de sauvegarde

Les fichiers de sortie devaient être sauvegardés sur un stockage en nuage. Dans notre cas d’utilisation, nous allons configurer une action Save to Dropbox. Dans l’image ci-dessus, vous pouvez voir une expression pour obtenir un texte à partir de l’action ‘Read text’. Vous pouvez copier-coller la même expression régulière ci-dessous dans le paramètre Nom du fichier de sortie.

${file.pages[0].PageText}.pdf

Enregistrez les fichiers de sortie dans la boîte de dépôt après les avoir nommés avec le texte lu.

L’expression passera le texte de l’emplacement spécifié du PDF et le transmettra au paramètre de nom de fichier de sortie afin que les fichiers soient renommés en fonction du texte lu.

Résumé du flux de travail final de lecture de texte à partir de PDF

Pour avoir accès à Workflows, il vous faut un Abonnement PDF4me. Vous pouvez même obtenir un Daypass et essayer Workflows pour voir comment il peut vous aider à automatiser vos tâches documentaires.

Related Blog Posts