Dokumentmerkmale definieren

RICOH ProcessDirector-Funktionen können Dokumentmerkmalwerte in der RICOH ProcessDirector-Datenbank speichern. Die Funktionen basieren auf Dokumentmerkmalen für die spätere Weiterverarbeitung im PDF-Format in RICOH ProcessDirector.
    Hinweis:
  • Lesen Sie den Überblick über Dokumentmerkmale, um sich genau darüber zu informieren, wie Dokumentmerkmale in RICOH ProcessDirector verwendet werden, damit Sie Ihr RICOH ProcessDirector-Feature umfassend nutzen können.
Gehen Sie wie folgt vor, um ein Dokumentmerkmal zu definieren:
  1. Öffnen Sie in Adobe Acrobat Professional eine PDF-Datei, und laden Sie entweder die Steuerdatei, die die Seitengruppendefinition enthält, oder erstellen Sie eine Seitengruppe.
  2. Klicken Sie mit der linken Maustaste in die linke obere Ecke der Daten, die Sie erfassen möchten. Ziehen Sie die Maus, um einen Rahmen um die Daten zu ziehen.
    Sie können die extrahierten Werte später anzeigen lassen, um die Auswahl zu überprüfen.
      Hinweis:
    • Die zu erfassenden Daten können Text- oder DataMatrix-Barcodes sein, die als Bilder kodiert werden.
    • Stellen Sie sicher, dass der Rahmen groß genug ist, um auch die größte Datenversion in der PDF-Datei zu erfassen. Einige Zeichen in einer PDF-Datei haben einen größeren Leerraum-Puffer als andere Zeichen. So kann die linke Kante eines Großbuchstabens einen Leerraum-Puffer von bis zu 0,01 cm benötigen, den Sie beim Erfassen dieses Buchstabens berücksichtigen müssen.
  3. Wählen Sie aus dem Popup-Menü die Option Dokumentmerkmal definieren.
  4. Wählen Sie ein RICOH ProcessDirector-Dokumentmerkmal aus der Liste aus oder geben Sie in das Feld einen Dokumentmerkmalnamen ein. Verwenden Sie keine Sonderzeichen (wie z. B. @, #, $, % oder -) oder Leerzeichen. Der RICOH ProcessDirector-Schritt IdentifyPDFDocuments schlägt möglicherweise fehl. Sie können Punkte und Unterstriche verwenden.
      Hinweis:
    • Beim Definieren von Dokumentmerkmalen können Sie ein Dokumentmerkmal mehrfach definieren. Beispiel: Sie haben unterschiedlich gestalteten Text in Ihrer PDF-Datei und müssen Postleitzahlen aus zwei verschiedenen Positionen erfassen. In diesem Fall können Sie das Postleitzahlen-Dokumentmerkmal zweimal definieren, solange Sie unterschiedliche bedingte Positionsregeln verwenden, die die Seiten angeben, aus denen das Merkmal extrahiert wird. Wenn Sie das gleiche Dokumentmerkmal auf zwei verschiedene Arten im Dokument definieren und deren Bedingungen jeweils nicht erfüllt sind, wird nur der zuletzt extrahierte Wert verwendet.
  5. Definieren Sie, aus welcher Art von Daten Werte extrahiert werden sollen.
    • Wenn Sie einen Bereich nur mit Text ausgewählt haben, wählen Sie unter Wählen aus Text aus.
    • Wenn Sie einen Bereich nur mit Barcodes ausgewählt haben, wählen Sie unter Wählen aus Barcode-Bild aus.
    • Wenn Sie einen Bereich mit Text und Barcodes ausgewählt haben, wählen Sie Text und Barcode-Bild aus.

      Die Textdaten werden vor den Barcode-Daten in der extrahierten Zeichenkette platziert, ohne einen Hinweis darauf, wo die Textdaten enden und die Barcode-Daten beginnen.

        Hinweis:
      • Wir empfehlen schwarze Barcodes. Farbige Barcodes können zu unvorhersehbaren Ergebnissen führen.

  6. Geben Sie die Seite in jedem Dokument an, von der ab Dokumentmerkmaldaten extrahiert werden. Gehen Sie auf eine der folgenden Arten vor:
    • Wählen Sie die Option Auf Regel basierende Seiten aus, und wählen Sie anschließend in der Dropdown-Liste eine Regel aus. Die Standardregel ist Nur erste Vorderseite. Alternativ können Sie wie folgt vorgehen:
      • Klicken Sie auf Symbol Inhalt hinzufügen Symbol zum Definieren einer neuen Regel.
      • Klicken Sie auf Symbol Regelmanager Symbol für den Aufruf des Regelmanagers.
        Wichtig:
      • Die Regeln Letzte Rückseite, Letzte Vorderseite und Letzte Seite funktionieren nicht mit der Extrahierung von Dokumentmerkmaldaten.
    • Wählen Sie Bestimmte Seiten und geben Sie die Seite in jedem Dokument ein, die Sie möchten.

      Wenn Sie mehrere Seiten angeben, extrahiert RICOH ProcessDirector-Plugin für Adobe Acrobat die Dokumentmerkmaldaten von der letzten bestimmten Seite in jedem Dokument. Beispiele:

      • Sie geben die Seiten 2–4 an. Wenn ein Dokument vier oder mehr Seiten hat, werden die Dokumentmerkmaldaten von Seite 4 extrahiert. Wenn ein Dokument drei Seiten hat, werden die Dokumentmerkmaldaten von Seite 3 extrahiert. Wenn ein Dokument zwei Seiten hat, werden die Dokumentmerkmaldaten von Seite 2 extrahiert.
      • Sie geben die Seiten 2,4 an. Wenn ein Dokument vier oder mehr Seiten hat, werden die Dokumentmerkmaldaten von Seite 4 extrahiert. Wenn ein Dokument 2-3 Seiten hat, werden die Dokumentmerkmaldaten von Seite 2 extrahiert.
      • Sie geben die Seiten 2–n an. Weil n die letzte Seite repräsentiert, werden die Dokumentmerkmaldaten von der letzten Seite extrahiert, wenn das Dokument zwei oder mehr Seiten hat.
          Wichtig:
        • Wenn Sie nur Seite n angeben, extrahiert RICOH ProcessDirector-Plugin für Adobe Acrobat die Dokumentmerkmaldaten von keiner Seite eines Dokuments.

  7. Optional: Klicken Sie auf das Symbol Bearbeiten (Symbol Zeile bearbeiten), um das Fenster "Text bearbeiten" zu öffnen, in dem Sie ein oder mehrere Modifikatorextrahierungsregeln definieren können, um genau das von Ihnen benötigte Dokumentmerkmal zu extrahieren.
    1. Wählen Sie einen der folgenden Modifikatoren:

      Inhaltsänderungswerte

      Geändert von Aktion
      Zeichen entfernen Geben Sie ein einziges Zeichen oder ein Leerzeichen ein (verwenden Sie die Leertaste zum Eingeben eines Leerzeichens), das Sie aus dem Wert entfernen wollen. Bei dem Zeichen muss die Groß-/Kleinschreibung beachtet werden. Wählen Sie dann eine der folgenden Schaltflächen aus:
      • Alle Vorkommen dieses Zeichens entfernen

        Das angegebene Zeichen wird an allen Positionen im Wert entfernt.

        Beispiel: Eine Kontonummer lautet 324-1443255-11. Sie können einen Bindestrich (-) eingeben, um alle Bindestriche aus dem Wert zu entfernen und die Kontonummer 324144325511 zu erstellen.

      • Führende Zeichen entfernen

        Das angegebene Zeichen wird am Anfang des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Anfang des Werts entfernt.

      • Abschließende Zeichen entfernen

        Das angegebene Zeichen wird am Ende des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Ende des Werts entfernt.

      • Führende und abschließende Zeichen entfernen

        Das angegebene Zeichen wird am Anfang und Ende des Werts entfernt. Wenn Sie beispielsweise ein Leerzeichen eingeben, werden alle Leerzeichen am Anfang und Ende des Werts entfernt.

      Unterzeichenfolge nach Position Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Liste Beginnen ab. Wählen Sie für Erste Position eine Zahl, um die Position des ersten Zeichens im Textwert anzugeben. Wählen Sie für Beizubehaltende Anzahl eine Zahl, um anzugeben, wie viele Zeichen beibehalten werden sollen.
      Unterzeichenfolge nach Begrenzer Geben Sie in das Feld Begrenzer ein Zeichen oder ein Leerzeichen ein, um anzugeben, wo der Textwert in getrennte Zeichenfolgensegmente unterteilt werden soll. Das Zeichen und die Textzeichenfolge unterscheiden in Groß- und Kleinschreibung.

      Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Dropdown-Liste Beginnen ab.

      Wählen Sie für Erste Position eine Zahl, um die Position des Begrenzers in der Textzeichenfolge anzugeben.

      Wählen Sie für Beizubehaltende Anzahl eine Zahl, um die Anzahl der beizubehaltenden Zeichenfolgensegmente festzulegen.

      Diese Beispiele zeigen, wie Segmente von Textzeichenfolgen durch die Angabe eines Begrenzers ausgewählt werden:

      • Für die Kontonummer 324-1443255-11 können Sie den Bindestrich als Begrenzer verwenden, um den Wert in diese drei Textzeichenfolgen aufzuteilen: 324, 1443255 und 11. Wählen Sie die Option Anfang der Zeile aus. Um die zweite und dritte Zeichenfolge (1443255 und 11) zu wählen, wählen Sie 2 für Erste Position und Beizubehaltende Anzahl.

      • Für die Postadresse Eldorado Springs CO 80025 können Sie ein Leerzeichen als Begrenzer verwenden, um den Wert in diese vier Textzeichenfolgen aufzuteilen: Eldorado, Springs, CO und 80025. Wählen Sie die Option Ende der Zeile aus.

        • Um die Postleitzahl auszuwählen, wählen Sie 1 für Erste Position und Beizubehaltende Anzahl.

        • Um den Staat auszuwählen, wählen Sie 2 für Erste Position und 1 für Beizubehaltende Anzahl.

        • Um die Stadt auszuwählen, wählen Sie 3 für Erste Position und 10 für Beizubehaltende Anzahl. Indem Sie 10 für Beizubehaltende Anzahl angeben, können Sie Städtenamen mit bis zu zehn Wörtern auswählen.

      Füllzeichen Wählen Sie Anfang der Zeile oder Ende der Zeile aus der Liste Position Füllzeichen. Geben Sie im Feld Füllzeichen ein Zeichen oder ein Leerzeichen als Füllzeichen ein.

      Geben Sie im Feld Minimale Fülltextlänge die minimale Länge der Textzeichenfolge ein. Wenn die Anzahl der Zeichen in der Textzeichenfolge kürzer als die Mindestlänge ist, werden Füllzeichen hinzugefügt, bis die Textzeichenfolge die Mindestlänge erreicht.

      Wenn Sie eine Textextrahierungsregel mit einem Modifikator definieren, enthält das Feld Zu ändernder Text die ausgewählte Zeile mit allen Veränderungen, die Sie an der Zeile vorgenommen haben. Das Feld Geänderter Wert rechts von einem Modifikator zeigt an, wie der Text aussieht, wenn der Modifikator auf den Text angewendet wird, der über den Modifikator oder das Feld Zu ändernder Text eingegangen ist (wenn Sie den ersten Modifikator festlegen).

    2. Wenden Sie weitere Modifikatoren an, bis Sie den gewünschten Wert aus der ausgewählten Zeile extrahiert haben. Klicken Sie auf Hinzufügen-Symbol, um einen neuen Modifikator hinzuzufügen. Das Feld Endgültiger Text unterhalb der Liste der Modifikatoren enthält den endgültigen, geänderten Wert, nachdem alle Modifikator-Extrahierungsregeln angewendet wurden.
      Für den ausgewählten Modifikator zeigt das Feld Modifikator Anfangstext unten im Fenster den ursprünglichen Wert vor der Änderung an. Das Feld Geänderter Text zeigt den Wert nach Anwendung des Modifikators an.
    3. Mit den Symbolen zur Verwaltung von Modifikatoren oben im Fenster können Sie die Modifikatorextrahierungsregeln löschen und neu anordnen. Verwenden Sie das Mülleimersymbol, um die ausgewählten Modifikatorextrahierungsregeln zu löschen. Mit den Pfeiltasten können Sie die Regeln neu anordnen. Die Regeln werden von oben nach unten auf die Zeile angewendet.
    4. Klicken Sie auf die Schaltfläche OK, um die Zeilenextrahierungsregel zu speichern.
  8. Klicken Sie auf OK, um das Dokumentmerkmal zu erstellen.
  9. Klicken Sie auf Ricoh Dokumentmerkmalwerte anzeigen, und durchsuchen Sie mehrere Dokumente in Ihrer PDF-Datei, um sicherzustellen, dass RICOH ProcessDirector-Plugin für Adobe Acrobat die richtigen Dokumentmerkmalwerte für jedes Dokument extrahiert.
  10. Wenn Sie bereit sind, alle Erweiterungen einschließlich der neuen Dokumentmerkmaldefinition in der PDF-Datei zu speichern, klicken Sie auf Ricoh Steuerdatei speichern.
  11. Geben Sie im RICOH ProcessDirector-Schritt IdentifyPDFDocuments den Dateinamen und den Speicherort für die Steuerdatei an, die die Dokumentmerkmaldefinition enthält.