Setup für die Verarbeitung von Dateisätzen mit PDF-Dokumenten und Daten einrichten

Um Dateisätze zu verarbeiten, die eines oder mehrere Dokumente in einer PDF-Datei und weitere Daten in einer Zusatz-Eingabedatei enthalten, richten Sie eine Eingabeeinheit ein, die eine der Stapelmethoden für Sätze verwendet: Anzahl der Sätze, Seiten in Sätzen oder Sätze nach Zeit. Dann richten Sie einen PDF-Workflow ein. Wenn der Schritt IdentifyPDFDocuments ausgeführt wird, erzeugt er einen einzigen PDF-Job, der alle einzelnen Dokumente enthält. Der Schritt beinhaltet die zusätzlichen Daten in der Dokumentmerkmaldatei (DPF) für die Nutzung durch andere Schritte im Workflow.
Der Schritt verwendet zwei Merkmale, um die zusätzlichen Daten zu identifizieren:
  • Der Wert des Merkmals Erweiterung der Zusatz-Eingabedatei identifiziert die Datei, die die Daten enthält.
  • Der Wert des Merkmals Header-Datei identifiziert die Datei, die angibt, welche Daten in der Zusatz-Eingabedatei zur DPF hinzugefügt werden sollen.

Dieses Verfahren nutzt ein Beispiel, um zu zeigen, wie Dateien mit enthaltenen PDF-Dokumenten und Daten verarbeitet werden.

  • Im Beispiel verwendet eine Versicherungsgesellschaft eine Anwendung, um Briefe an Kunden zu erstellen. Jeder Brief ist in einer separaten PDF-Datei. Die von der Anwendung produzierten Briefe enthalten nicht den Namen, die Telefonnummer und die E-Mail-Adresse des Agenten für den Kunden.
  • Eine separate Anwendung erstellt durch Kommas getrennte Dateien (CSV) mit den Agenten-Informationen und anderen Daten, die dem Unternehmen beim Verfassen und Weiterleiten der Briefe helfen. Die beiden Anwendungen geben gleichzeitig Hunderte von Dateipaaren aus.
  • Um die Verarbeitung der Briefe zu optimieren und die Kontaktinformationen für den Agenten hinzuzufügen, bündelt das Unternehmen die Briefe in Stapeln von 50 Briefen in einem einzigen PDF-Job zusammen mit den 50 CSV-Dateien, die zum Lesen der Agenten-Daten erforderlich sind, in den DPF, den die anderen Schritte im Workflow verwenden.

Bevor Sie einen Workflow und eine Eingabeeinheit einrichten:

  • Stellen Sie sicher, dass die Zusatz-Eingabedatei die folgenden Anforderungen enthält:
    • Die Kopfzeile enthält die Datenbanknamen der Dokumentmerkmale, durch Kommas getrennt, für jeden Datenwert, den Sie zur Dokumentmerkmaldatei hinzufügen möchten.
    • Die Datei hat eine Datenzeile für jedes Dokument in der zugehörigen PDF-Datei.
    • In jeder Datenzeile sind die Werte für die Dokumentmerkmale durch Kommas getrennt.

    Diese Zusatz-Eingabedatei ist zum Beispiel mit einer PDF-Datei verknüpft, die ein Dokument enthält. Die Datei enthält eine Kopfzeile und eine Datenzeile mit fünf Datenwerten:

    Doc.Custom.AgentName,Doc.Custom.AgentPhone,Doc.Custom.AgentEmail,Region,AgentCodeKelly Lopez,1-800-555-1234,kelly.lopez@insurancebiz.com,Southeast,B475

  • Stellen Sie sicher, dass die Überschriften für alle Datenwerte, die Sie im Workflow verwenden möchten, als RICOH ProcessDirector-Dokumentmerkmale definiert sind.

    In diesem Beispiel möchten Sie die Werte für das Doc.Custom.AgentName, Doc.Custom.AgentPhone und Doc.Custom.AgentEmail in einem Schritt auf der Basis der Schrittvorlage EmailDocuments verwenden.

    Definieren Sie Doc.Custom.AgentName, Doc.Custom.AgentPhone und Doc.Custom.AgentEmail als benutzerdefinierte Dokumentmerkmale.

      Hinweis:
    • Wir empfehlen, die Namen von benutzerdefinierten Dokumentmerkmalen mit Doc.Custom beginnen zu lassen.
    • Wenn Sie einen Datenwert nicht im Workflow verwenden möchten, müssen Sie die Überschrift für den Datenwert nicht als RICOH ProcessDirector-Dokumentmerkmal definieren. Im Beispiel definieren Sie AgentRegion und AgentCode nicht als RICOH ProcessDirector-Dokumentmerkmale.

  • Erstellen Sie eine Header-Datei, die die Datenbanknamen der Dokumentmerkmale auflistet, deren Werte Sie zur DPF hinzufügen möchten. Jeder Datenbankmerkmalname befindet sich in einer separaten Zeile.

    Sie erstellen beispielsweise eine Datei header.txt mit diesem Inhalt:

    Doc.Custom.AgentNameDoc.Custom.AgentPhoneDoc.Custom.AgentEmail

    Wenn der Schritt IdentifyPDFDocuments in Ihrem Workflow den Dateisatz im Beispiel verarbeitet, erstellt er eine Dokumentmerkmaldatei mit extrahierten Daten aus den Briefen und Daten aus der Zusatz-Eingabedatei. Das Unternehmen hat zum Beispiel Kundennamen und Kunden-E-Mail-Adressen im Brief zu Dokumentmerkmalen in der Identify-PDF-Steuerdatei zugeordnet. Der Schritt IdentifyPDFDocuments erzeugt eine DPF mit den folgenden Werten:

    Doc.Custom.CustomerName Doc.EmailAddress       Doc.Custom.AgentNameDoc.Custom.AgentPhone Doc.Custom.AgentEmailChris Smith            chris.smith@myisp.com  Kelly Lopez1-800-555-1234        kelly.lopez@insurancebiz.com

So richten Sie das Setup für die Verarbeitung von Dateisätzen mit PDF-Dokumenten und Daten ein:
  1. Klicken Sie auf die Registerkarte Verwaltung.
  2. Klicken Sie im linken Teilfenster auf Einheiten Eingabeeinheiten.
  3. Fügen Sie eine Eingabeeinheit des Typs "Ordner für Sofortdruck" hinzu oder kopieren Sie sie.

    Klicken Sie zum Beispiel auf Hinzufügen Ordner für Sofortdruck, und geben Sie der Eingabeeinheit den Namen PDFInputFromSets.

  4. Geben Sie auf allen Registerkarten die erforderlichen und optionalen Merkmale ein, die Sie korrigieren müssen, damit sie in Ihrer Umgebung übereinstimmen.
  5. Auf die Registerkarte Allgemein klicken.
  6. Wählen Sie für das Merkmal Untergeordneter Workflow den Namen des Workflows, den Sie ändern, um Dateisätze zu verarbeiten.

    Wählen Sie beispielsweise PDFDocumentsFromSets.

    Wenn Sie einen neuen Workflow erstellen, verwenden Sie den Standard-Wert. Zeigen Sie nach dem Speichern des neuen Workflows die Merkmale für die Eingabeeinheit an, und wählen Sie den Workflow als Wert dieses Merkmals aus.

  7. Klicken Sie auf die Registerkarte Stapeln.
  8. Wählen Sie für das Merkmal Stapelmethode die Anzahl der Sätze, Seiten in Sätzen oder Sätze nach Zeit.
  9. Geben Sie Werte für andere Merkmale im Zusammenhang mit der Stapelmethode an, die Sie ausgewählt haben.

    Die Eingabeeinheit soll zum Beispiel Dateien stapeln und an den Workflow übermitteln, wenn sie 50 Sätze von PDF- und CSV-Dateien empfangen hat. Geben Sie für das Merkmal Anzahl zu stapelnder Dateien den Wert 50 ein.

  10. Geben Sie einen Wert für das Merkmal Übereinstimmendes Muster für Sätze ein, oder verwenden Sie den Standardwert:
    (.+?)\.[^.]*$|$

    Der Standardwert weist RICOH ProcessDirector an, Dateien, deren Namen bis auf die Erweiterungen identisch sind, zum gleichen Satz hinzuzufügen.

    Beispiel:

    customer_1.pdfcustomer_1.csv

  11. Für das Merkmal Datenmuster geben Sie Folgendes ein: .*pdf$
  12. Geben Sie Merkmalwerte für das Dateimuster ein, das eine Zusatz-Eingabedatei identifiziert.

    Geben Sie zum Beispiel diese Werte für eine Zusatz-Eingabedatei mit der Dateierweiterung CSV ein:

    • Dateimuster: .*csv$
    • Spooldateiverwendung: auxinput
    • Spooldateityp: csv
    • Erforderliches Dateimuster: Ja
    • Dateimusterfolge: 1

    Sie können in RICOH ProcessDirector einen beliebigen Wert für das Merkmal Spooldateiverwendung verwenden, der kein RICOH ProcessDirector-Schlüsselwort ist. Schlüsselwörter sind control (Steuerung), overrides (Überschreibungen) und print (Drucken).

  13. Klicken Sie auf Hinzufügen.
  14. Wenn die Einstellung der Merkmalwerte für die Eingabeeinheit abgeschlossen ist, klicken Sie auf OK.
  15. Klicken Sie auf die Registerkarte Workflow.
  16. Öffnen Sie einen Workflow, den Sie ändern wollen, oder erstellen Sie einen neuen Workflow.

    Sie kopieren und ändern beispielsweise den bereitgestellten EnhancePDFDocuments-Workflow. Sie nennen den kopierten Workflow PDFDocumentsFromSets.

  17. Fügen Sie einen auf der Schrittvorlage IdentifyPDFDocuments basierenden Schritt hinzu oder ändern Sie ihn.
  18. Legen Sie Werte für die Merkmale des Schritts IdentifyPDFDocuments fest:
    1. Geben Sie für das Merkmal Identify-PDF-Steuerdatei den vollständigen Pfad oder symbolischen Namen der Steuerdatei an, die Sie mit RICOH ProcessDirector-Plugin für Adobe Acrobat erstellt haben.

      Die Standard-Identify-PDF-Steuerdatei definiert jede PDF-Datei als einzelnes Dokument. Verwenden Sie RICOH ProcessDirector-Plugin für Adobe Acrobat, um in folgenden Fällen eine benutzerdefinierte Steuerdatei zu erstellen:

      • Ihre PDF-Dateien enthalten zwei oder mehr Dokumente.
      • Sie möchten Markups zu den Dokumenten hinzufügen.
      • Sie möchten Daten in den Dokumenten zu Dokumentmerkmalen zuordnen.

    2. Geben Sie für das Merkmal Erweiterung der Zusatz-Eingabedatei die Dateierweiterung der Zusatz-Eingabedateien ein.

      Stellen Sie sicher, dass dieser Wert dem Wert des Merkmals Spooldateityp für das Muster der Zusatz-Eingabedatei entspricht, das Sie auf der Eingabeeinheit definiert haben.

      Im Beispiel haben die Zusatz-Eingabedateien eine CSV-Erweiterung. Geben Sie Folgendes ein: csv

    3. Für das Merkmal Header-Datei geben Sie den vollständigen Pfad und Namen der Datei ein, die auflistet, welche Werte von der Zusatz-Eingabedatei in die DPF kopiert werden sollen.

      Geben Sie beispielsweise /aiw/aiw1/aux_input/headers.txt (Linux) oder C:\aiw\aiw1\aux_input\headers.txt (Windows) ein.

  19. Nehmen Sie andere Änderungen am Workflow nach Bedarf vor.
  20. Speichern Sie den Workflow.
  21. Testen Sie die Eingabeeinheit und den Workflow:
    1. Aktivieren Sie den Workflow.
    2. Aktivieren und verbinden Sie die Eingabeeinheit, die die Jobs zum Workflow senden.
    3. Übermitteln Sie Sätze von PDF- und CSV-Dateien an die Eingabeeinheit, bis sie die Grenze erreichen, bei der die Eingabeeinheit die Dateien stapelt und sie an den Workflow übermittelt.
      In diesem Beispiel übermittelt die Eingabeeinheit 50 Sätze von PDF- und CSV-Dateien.
Wenn der Schritt IdentifyPDFDocuments ausgeführt wird, erzeugt er diese Ausgabe:
  • Eine einzelne PDF-Datei mit allen Dokumenten aus allen Sätzen.
  • Ein Verzeichnis Sätze, das ein Unterverzeichnis für jeden Dateisatz enthält.
  • Eine Dokumentmerkmaldatei, die die Werte für alle Daten enthält, die in der Identify-PDF-Steuerdatei Dokumentmerkmalen zugeordnet sind, und die Werte der Daten aus den Zusatz-Eingabedateien.