Mehrere Dokumentmerkmale definieren

Sie können mehrere Dokumentmerkmale in einem Datenblock in einer POF-Datei definieren. Ein Datenblock kann Text, DataMatrix-Barcodes, die als Bilder kodiert sind, oder beides sein.
    Hinweis:
  • Lesen Sie den Überblick über Dokumentmerkmale, um sich genau darüber zu informieren, wie Dokumentmerkmale in RICOH ProcessDirector verwendet werden, damit Sie Ihr RICOH ProcessDirector-Feature umfassend nutzen können.
Gehen Sie wie folgt vor, um mehrere Dokumentmerkmale zu definieren:
  1. Öffnen Sie in Adobe Acrobat Professional eine PDF-Datei, und laden Sie entweder die Steuerdatei, die die Seitengruppendefinition enthält, oder erstellen Sie eine Seitengruppe.
  2. Klicken Sie mit der linken Maustaste in die linke obere Ecke des Datenblocks, den Sie erfassen möchten. Ziehen Sie die Maus, um einen Rahmen um den Datenblock zu ziehen. Sie können die extrahierten Werte später anzeigen lassen, um die Auswahl zu überprüfen.
      Hinweis:
    • Vergewissern Sie sich, dass der Rahmen groß genug ist, um auch die längste Zeile mit Daten in der PDF-Datei zu erfassen. Einige Zeichen in einer PDF-Datei haben einen größeren Leerraum-Puffer als andere Zeichen. So kann die linke Kante eines Großbuchstabens einen Leerraum-Puffer von bis zu 0,01 cm benötigen, den Sie beim Erfassen dieses Buchstabens oder dieser Zeile berücksichtigen müssen.
  3. Wählen Sie aus dem Popup-Menü die Option Mehrere Dokumentmerkmale definieren.
  4. Geben Sie einen Namen für den Block mehrerer Datenmerkmale ein. Verwenden Sie in dem Namen keine Leerzeichen oder Sonderzeichen (wie z. B. @, #, $, % oder -). Sie können Punkte und Unterstriche verwenden.
  5. Definieren Sie, aus welcher Art von Daten Werte extrahiert werden sollen.
    • Wenn Sie einen Bereich nur mit Text ausgewählt haben, wählen Sie unter Wählen aus Text aus.
    • Wenn Sie einen Bereich nur mit Barcodes ausgewählt haben, wählen Sie unter Wählen aus Barcode-Bild aus.
    • Wenn Sie einen Bereich mit Text und Barcodes ausgewählt haben, wählen Sie Text und Barcode-Bild aus.

      Die Textdaten werden vor den Barcode-Daten in der extrahierten Zeichenkette platziert, ohne einen Hinweis darauf, wo die Textdaten enden und die Barcode-Daten beginnen.

  6. Geben Sie die Seite in jedem Dokument an, von der ab Dokumentmerkmaldaten extrahiert werden. Führen Sie einen der folgenden Schritte aus:
    • Wählen Sie die Option Auf Regel basierende Seiten aus, und wählen Sie anschließend in der Liste eine Regel aus. Die Standardregel ist Nur erste Vorderseite. Alternativ können Sie wie folgt vorgehen:
      • Klicken Sie auf Symbol Inhalt hinzufügen Symbol zum Definieren einer neuen Regel.
      • Klicken Sie auf Symbol Regelmanager Symbol für den Aufruf des Regelmanagers.
        Wichtig:
      • Die Regeln Letzte Rückseite, Letzte Vorderseite und Letzte Seite funktionieren nicht mit der Extrahierung von Dokumentmerkmaldaten.
    • Wählen Sie Bestimmte Seiten und geben Sie die Seite in jedem Dokument ein, die Sie möchten.

      Wenn Sie mehrere Seiten angeben, extrahiert RICOH ProcessDirector-Plugin für Adobe Acrobat die Dokumentmerkmaldaten von der letzten bestimmten Seite in jedem Dokument. Beispiele:

      • Sie geben die Seiten 2–4 an. Wenn ein Dokument vier oder mehr Seiten hat, werden die Dokumentmerkmaldaten von Seite 4 extrahiert. Wenn ein Dokument drei Seiten hat, werden die Dokumentmerkmaldaten von Seite 3 extrahiert. Wenn ein Dokument zwei Seiten hat, werden die Dokumentmerkmaldaten von Seite 2 extrahiert.
      • Sie geben die Seiten 2,4 an. Wenn ein Dokument vier oder mehr Seiten hat, werden die Dokumentmerkmaldaten von Seite 4 extrahiert. Wenn ein Dokument 2-3 Seiten hat, werden die Dokumentmerkmaldaten von Seite 2 extrahiert.
      • Sie geben die Seiten 2–n an. Weil n die letzte Seite repräsentiert, werden die Dokumentmerkmaldaten von der letzten Seite extrahiert, wenn das Dokument zwei oder mehr Seiten hat.
          Wichtig:
        • Wenn Sie nur Seite n angeben, extrahiert RICOH ProcessDirector-Plugin für Adobe Acrobat die Dokumentmerkmaldaten von keiner Seite eines Dokuments.

  7. Im Bereich "Dokumentmerkmale" des Definitionsfensters können Sie ein Dokumentmerkmal wählen und die Merkmalextrahierungsregel definieren. Dieser Bereich umfasst den vollständigen Text der ersten Zeile der gewählten Textdaten. Wenn Sie einen existierenden Textblock bearbeiten möchten, werden in diesem Bereich alle Dokumentmerkmale aufgeführt, die Sie für den Textblock definiert haben. Gehen Sie wie beschrieben vor, um ein neues Dokumentmerkmal sowie die entsprechende Modifikatorextrahierungsregel zu erstellen.
    1. Klicken Sie auf das Symbol Hinzufügen (Symbol zum Hinzufügen von Dokumentmerkmalen), um eine neue Zeile für Dokumentmerkmaldefinitionen hinzuzufügen.
    2. Wählen Sie ein RICOH ProcessDirector-Dokumentmerkmal in der Liste Merkmal. Sie können eigene Dokumentmerkmale erstellen, indem Sie einen Dokumentmerkmalnamen eingeben. Allerdings kann dieses Merkmal nicht in verwendet werden RICOH ProcessDirector. Sie sollten eigene Dokumentmerkmale nur definieren, wenn Sie ausschließlich RICOH ProcessDirector-Plugin für Adobe Acrobat verwenden, um Dokumenteigenschaftswerte in eine Textdatei zu exportieren.
    3. Wählen Sie die Zeile im Textblock, aus der Sie das ausgewählte Dokumentmerkmal extrahieren möchten. Sie können die Zeile mit einer Oben-Unten- oder einer Unten-Oben-Referenz wählen. Um eine Zeile mit der Referenz Oben-Unten zu wählen, verwenden Sie 1 bis n (wobei n eine positive Ganzzahl ist). Für eine Unten-Oben-Referenz wählen Sie Letzte oder Letzte - x (wobei x für die Anzahl der Reihen ab der letzten Reihe steht). Sie können den Zeilenwert nicht nur aus der Liste wählen, sondern die Zeilenzahl auch direkt im Feld Zeile eingeben.
    4. Klicken Sie auf das Symbol Bearbeiten (Symbol "Zeile bearbeiten"), um das Fenster "Text bearbeiten" zu öffnen. Dort können Sie eine oder mehrere Modifikatorextrahierungsregeln definieren, um genau das von Ihnen benötigte Dokumentmerkmal zu extrahieren.
    5. Wählen Sie einen der folgenden Modifikatoren:

      Inhaltsänderungswerte

      Geändert von Aktion
      Zeichen entfernen Geben Sie ein einziges Zeichen oder ein Leerzeichen ein (verwenden Sie die Leertaste zum Eingeben eines Leerzeichens), das Sie aus dem Wert entfernen wollen. Bei dem Zeichen muss die Groß-/Kleinschreibung beachtet werden. Wählen Sie dann eine der folgenden Schaltflächen aus:
      • Alle Vorkommen dieses Zeichens entfernen

        Das angegebene Zeichen wird an allen Positionen im Wert entfernt.

        Beispiel: Eine Kontonummer lautet 324-1443255-11. Sie können einen Bindestrich (-) eingeben, um alle Bindestriche aus dem Wert zu entfernen und die Kontonummer 324144325511 zu erstellen.

      • Führende Zeichen entfernen

        Das angegebene Zeichen wird am Anfang des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Anfang des Werts entfernt.

      • Abschließende Zeichen entfernen

        Das angegebene Zeichen wird am Ende des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Ende des Werts entfernt.

      • Führende und abschließende Zeichen entfernen

        Das angegebene Zeichen wird am Anfang und Ende des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Anfang und Ende des Werts entfernt.

      Unterzeichenfolge nach Position Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Liste Beginnen ab. Wählen Sie für Erste Position eine Zahl, um die Position des ersten Zeichens im Textwert anzugeben. Wählen Sie für Beizubehaltende Anzahl eine Zahl, um anzugeben, wie viele Zeichen beibehalten werden sollen.
      Unterzeichenfolge nach Begrenzer Geben Sie in das Feld Begrenzer ein Zeichen oder ein Leerzeichen ein, um anzugeben, wo der Textwert in getrennte Zeichenfolgensegmente unterteilt werden soll. Das Zeichen und die Textzeichenfolge unterscheiden in Groß- und Kleinschreibung.

      Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Dropdown-Liste Beginnen ab.

      Wählen Sie für Erste Position eine Zahl, um die Position des Begrenzers in der Textzeichenfolge anzugeben.

      Wählen Sie für Beizubehaltende Anzahl eine Zahl, um die Anzahl der beizubehaltenden Zeichenfolgensegmente festzulegen.

      Diese Beispiele zeigen, wie Segmente von Textzeichenfolgen durch die Angabe eines Begrenzers ausgewählt werden:

      • Für die Kontonummer 324-1443255-11 können Sie den Bindestrich als Begrenzer verwenden, um den Wert in diese drei Textzeichenfolgen aufzuteilen: 324, 1443255 und 11. Wählen Sie die Option Anfang der Zeile aus. Um die zweite und dritte Zeichenfolge (1443255 und 11) zu wählen, wählen Sie 2 für Erste Position und Beizubehaltende Anzahl.

      • Für die Postadresse Eldorado Springs CO 80025 können Sie ein Leerzeichen als Begrenzer verwenden, um den Wert in diese vier Textzeichenfolgen aufzuteilen: Eldorado, Springs, CO und 80025. Wählen Sie die Option Ende der Zeile aus.

        • Um die Postleitzahl auszuwählen, wählen Sie 1 für Erste Position und Beizubehaltende Anzahl.

        • Um den Staat auszuwählen, wählen Sie 2 für Erste Position und 1 für Beizubehaltende Anzahl.

        • Um die Stadt auszuwählen, wählen Sie 3 für Erste Position und 10 für Beizubehaltende Anzahl. Indem Sie 10 für Beizubehaltende Anzahl angeben, können Sie Städtenamen mit bis zu zehn Wörtern auswählen.

      Füllzeichen Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Liste Position Füllzeichen. Geben Sie im Feld Füllzeichen ein Zeichen oder ein Leerzeichen als Füllzeichen ein.

      Geben Sie im Feld Minimale Fülltextlänge die minimale Länge der Textzeichenfolge ein. Wenn die Anzahl der Zeichen in der Textzeichenfolge kürzer als die Mindestlänge ist, werden Füllzeichen hinzugefügt, bis die Textzeichenfolge die Mindestlänge erreicht.

      Wenn Sie eine Textextrahierungsregel mit einem Modifikator definieren, enthält das Feld Zu ändernder Text die ausgewählte Zeile mit allen Veränderungen, die Sie an der Zeile vorgenommen haben. Das Feld Geänderter Wert rechts von einem Modifikator zeigt an, wie der Text aussieht, wenn der Modifikator auf den Text angewendet wird, der über den Modifikator oder das Feld Zu ändernder Text eingegangen ist (wenn Sie den ersten Modifikator festlegen).

    6. Wenden Sie weitere Modifikatoren an, bis Sie den gewünschten Wert aus der ausgewählten Zeile extrahiert haben. Klicken Sie auf Hinzufügen-Symbol, um einen neuen Modifikator hinzuzufügen. Das Feld Endgültiger Text unterhalb der Liste der Modifikatoren enthält den endgültigen, geänderten Wert, nachdem alle Modifikator-Extrahierungsregeln angewendet wurden.
      Für den ausgewählten Modifikator zeigt das Feld Modifikator Anfangstext unten im Fenster den ursprünglichen Wert vor der Änderung an. Das Feld Geänderter Text zeigt den Wert nach Anwendung des Modifikators an.
    7. Mit den Symbolen zur Verwaltung von Modifikatoren oben im Fenster können Sie die Modifikatorextrahierungsregeln löschen und neu anordnen. Verwenden Sie das Mülleimersymbol, um die ausgewählten Modifikatorextrahierungsregeln zu löschen. Mit den Pfeiltasten können Sie die Regeln neu anordnen. Die Regeln werden von oben nach unten auf die Zeile angewendet.
    8. Klicken Sie auf die Schaltfläche OK, um die Zeilenextrahierungsregel zu speichern.
  8. Legen Sie weitere Dokumentmerkmale fest, die Sie aus einer Zeile im Block extrahieren möchten. Sie können dieselbe Zeile auswählen, die Sie für andere Dokumentmerkmale verwendet haben. Wenn Sie ein Dokumentmerkmal löschen oder die Reihenfolge verändern möchten, aktivieren Sie das Kontrollkästchen neben dem Dokumentmerkmal und klicken Sie auf Mülleimersymbol und die Pfeiltasten.
  9. Wenn Sie alle Dokumentmerkmale definiert haben, klicken Sie auf OK.
  10. Klicken Sie auf Ricoh Dokumentmerkmalwerte anzeigen, um zu überprüfen, ob die Merkmale den gewünschten Inhalt besitzen.
  11. Optional: Sie können die Textblockdefinition bearbeiten, indem Sie doppelt auf das entsprechende Feld klicken oder mit der rechten Maustaste auf das Feld klicken und Bearbeiten auswählen.
  12. Wenn Sie bereit sind, alle Erweiterungen einschließlich der neuen Definition der Dokumentmerkmale in der PDF-Datei zu speichern, klicken Sie auf Ricoh Steuerdatei speichern.
  13. Verschieben Sie die Steuerdatei in ein Verzeichnis, das vom RICOH ProcessDirector-Server verwendet wird, und fügen Sie den Namen und das Verzeichnis in den RICOH ProcessDirector-Schritt IdentifyPDFDocuments ein. Diese Steuerdatei muss auch die Seitengruppendefinition enthalten, die die Dokumente der PDF-Dateien definiert, die von diesem Schritt verarbeitet werden.