Taranan PDF belgelerini otomatik olarak sıralayın ve yeniden adlandırın

By Nishanth Asokan | Otomasyonu

Taranan PDF belgelerini otomatik olarak sıralayın ve yeniden adlandırın

Belge sınıflandırma, neredeyse tüm endüstrilerde onlarca yıldır büyük bir zorluktur ve çeşitli iş süreçlerinde çok önemli bir gerekliliğe sahiptir. Geleneksel olarak, bu işlem, kullanıcıların belgeyi okuması ve belgeleri sınıflandırmak için konuyu tanımlaması gibi manuel olarak yapılır. Manuel süreç daha kesin sınıflandırmaya yardımcı olsa da, büyük ölçüde zaman alıcı ve çok pahalıdır.

İş süreçlerinin dijitalleştirilmesi, zaman içinde önemli manuel çabaları azalttı ve bu da ekonomilerin daha hızlı büyümesine neden oldu. Piyasada halihazırda mevcut olan ve iş süreçlerinin daha hızlı ve kolay ölçeklenebilir olmasını kolaylaştırabilecek birçok belge çalışması otomasyon aracı ve hizmeti bulunmaktadır. Bunun bir parçası olarak, iş sürecinize giren büyük hacimli belgeleri düzenlemenin daha hızlı olması gerekir. Sıralama ve düzenleme süreci, PDF4me Workflow özelliği kullanılarak destekleyici özelliklerle otomatik olarak yapılabilir.

Daha iyi anlamanız için belirli bir kullanım örneği aldık

  • Belgeden normal ifadeler kullanarak Fatura Numarasını bulun ve dosyayı fatura numarası ile yeniden adlandırın ve adım adım ayrıntılı olarak açıklayın.

Belgelerinizi sıralamak, yeniden adlandırmak ve iyi sıralanmış depolama alanına kaydetmek için 3 Kolay Adım.

1. Adım: OCR’yi yalnızca gerektiğinde yapın

OCR ile taranan belgelerdeki metni tanıyın

Bu, PDF4me’den iş akışı eyleminizin ilk adımı olacaktır. PDF OCR eylemi, girdi belgenizin taranmış bir belge mi yoksa metin tabanlı bir belge mi olduğunu algılayabilen ve yalnızca gerektiğinde OCR uygulayabilen güçlü bir özelliktir. Genellikle, OCR, güçlü OCR motorları ve ilgili bileşenlerle dolu özel kaynaklar içerdiğinden diğer özelliklerden biraz daha maliyetlidir.

Otomasyon iş akışında, bazen belge taranmış bir görüntü olduğunda OCR’ye ihtiyaç duyabileceğiniz durumlar olabilir. Belgenizde taranmış görüntü olmadığında gerçekten OCR uygulamanız gerekmediğinde gereksiz yere ödeme yapmanız gerekmez. İş akışınıza OCR eylemi eklerken “Gerektiğinde OCR Yap” seçeneğini etkinleştirmeniz yeterlidir. Bu eylem, dönüştürme işleminden sonra metin tabanlı bir PDF dosyası oluşturur veya dönüştürme gerektirmediğinde aynı dosyayı döndürür.

2. Adım: PDF belgenizin her sayfasından metin çıkarın

OCR ile tanıdıktan sonra metni ayıklayın

Metin Ayıkla iş akışı eylemi, tüm sayfa içeriğinizi bir sonraki eylem veri bağlamınıza getirecektir. Bu, içeriğinizle istediğiniz gibi oynayabileceğiniz anlamına gelir - örneğin belirli bir metni ayrıştırmak, istediğiniz metnin bulunup bulunmadığını kontrol etmek, ayrıştırılmış metninizi özel metninizle birleştirmek ve daha pek çok şey JavaScript ifadeleri gibi. Bu örnekte, çevrimiçi ödenen bir makbuzdan fatura numarasını bulmaya çalışılacaktır.

Örnek fatura PDF’si:

Örnek bir fatura

Bu PDF dosyasından fatura numarasını ayrıştırmak istiyoruz ve bu numarayı kullanarak dosyayı yeniden adlandıracağız ve sonunda PDF4me’nin Belgelerim bulut deposunda saklayacağız.

Bu eylemin çıktı verileri bağlamı, metni aşağıdaki biçimde içerecektir.

${file.pages[0].PageText}

[0] - bu, sıfırdan başlayan sayfa numarasını belirtir, bu, PDF belgenizin herhangi bir sayfa aralığından sayfa metnini almak için herhangi bir sayıya ayarlanabilir.

Aşağıdaki gibi PageText veri bağlamından bir eşleşme bulmak için normal ifade ekleyin.

${file.pages[0].PageText.match(/Invoice\s*?[#-]\s*[0-9]*/g)}

Bu, veri bağlamı sonuçlarınızla birlikte normal ifadeyi uygulamak için basit bir JavaScript işlevidir. Bu normal ifade, Fatura etiketiyle birlikte fatura numarasını bulmaya çalışıyor.

Bunun gibi, belgenizi tanımlamak için herhangi bir mantıksal işlevi uygulamak ve belgenizi daha doğru bir şekilde ve herhangi bir manuel çaba harcamadan sınıflandırmaya karar vermek için JavaScript işlevlerini kullanabilirsiniz.

Adım 3: Yeniden adlandırın ve Belge Depom’a kaydedin

MyDoc’a Kaydet, belgenizi PDF4me deposuna kaydetmenizi sağlayan bir PDF4me eylemidir. Bunu Dropbox, FTP veya Google Drive’ınızda saklamak istiyorsanız da mümkündür. Gösteri amacıyla şimdilik Belgelerim deposunu kullanıyoruz. Tüm kaydetme eylemleri, zorunlu olmayan bir alan olan Çıktı Dosya Adına sahiptir.

Dosyaları özel adla Belgelerim'e kaydedin

Özel dosya adınızı ${INV}-{UTCNOW()}.pdf gibi herhangi bir dinamik kombinasyonla ayarlayabilirsiniz - Bu, dinamik olarak INV- ön eki ve son eki geçerli UTC saati olan belgeler üretecektir. Neyin nasıl saklanacağı ve çıktı belgelerinizin nerede saklanacağı konusunda kontrol sizde olur. Gösteri kullanım durumumuzda, aşağıdaki gibi yeni bir dosya adı oluşturmak için veri bağlamını normal ifadeyle birlikte yerleştirmemiz gerekiyor.

${file.pages[0].PageText.match(/Invoice\s*?[#-]\s*[0-9]*/g)}.pdf

Taranan belgeleri sıralamak ve yeniden adlandırmak için Örnek İş Akışı

Tüm bu ağaç adımlarını uyguladıktan sonra belgeniz sınıflandırılacak, yeniden adlandırılacak ve istediğiniz dosya depolama konumunda saklanacaktır. Şimdi bu senin için ne kadar kolay? Evet, PDF4me her zaman son kullanıcı perspektifinden düşünür ve belge işleme dünyasında hayatlarını çok kolaylaştırır.

Related Blog Posts