PDF 文書とデータを含むファイルのセットを処理するように設定する

PDFファイル内の文書と補助入力ファイルの追加データを含むファイルをセットで処理するには、次のいずれかの、セットのバッチ方法を使用する入力装置を調整します。 セット数セット内のページ数、または 時刻によるセット。PDF ワークフローをセットアップする前に、次の操作を行います。 IdentifyPDFDocumentsステップを実行すると、個々の文書をすべて含んだ 1 つの PDF ジョブが作成されます。このステップは、ワークフロー内の他のステップで使用するために、文書プロパティーファイル (DPF) に追加的なデータを含めます。
このステップは、2 つのプロパティーを使用して追加的なデータを識別します。
  • 補助入力ファイル拡張子プロパティー値は、データを含むファイルを識別します。
  • ヘッダーファイルプロパティー値は、DPF に追加する補助入力ファイル内のデータを指定したファイルを識別します。

この手順では、例に基づいて、PDF 文書とデータを含むファイルのセットを処理する方法について説明します。

  • この例では、保険会社がアプリケーションを使用して顧客に郵送する書面を作成します。それぞれの書面は、PDF ファイルに個別に保存されます。アプリケーションで作成する書面には、顧客の代理店の名前、電話番号、メールアドレスを含めません。
  • 別のアプリケーションが、代理店の情報や、書面の作成と郵送に役立つその他のデータで、コンマ区切り値 (CSV) ファイルを作成します。2 つのアプリケーションが同時に 100 組のファイルを出力します。
  • 書面の処理や、代理店の連絡先情報を追加する処理を最適化するため、この保険会社は 50 個の CSV ファイルを使用して、50 通の書面を 1 つの PDF ジョブに結合することにしてています。この CSV ファイルは、ワークフロー内の別のステップが使用する DPF に、代理店のデータを読み込むために必要とされます。

ワークフローと入力装置をセットアップする前に、次の操作を行います。

  • 補助入力ファイルが以下の要件を満たしていることを確認します。
    • ヘッダー行では、文書プロパティーファイルに追加するデータ値ごとに、コンマで区切って文書プロパティーのデータベース名を指定します。
    • このファイルでは、関連付けられた PDF ファイル内の文書ごとに 1 つのデータ行を指定します。
    • 各データ行では、文書プロパティーの値をコンマで区切ります。

    例えば、この補助入力ファイルは、1 つの文書を含む PDF ファイルと関連付けられます。このファイルは、ヘッダー行と、5 つのデータ値がある 1 行のデータ行で構成されています。

    Doc.Custom.AgentName,Doc.Custom.AgentPhone,Doc.Custom.AgentEmail,Region,AgentCodeKelly Lopez,1-800-555-1234,kelly.lopez@insurancebiz.com,Southeast,B475

  • ワークフローで使用するすべてのデータ値の見出しが RICOH ProcessDirector 文書プロパティーとして定義されていることを確認します。

    この例では、EmailDocumentsステップテンプレートに基づくステップで、Doc.Custom.AgentNameDoc.Custom.AgentPhone、および Doc.Custom.AgentEmail の値を使用します。

    Doc.Custom.AgentNameDoc.Custom.AgentPhone、および Doc.Custom.AgentEmailは、カスタム文書プロパティーとして定義します。

      注意:
    • カスタム文書プロパティーの名前は先頭にDoc.Customを付加することをお勧めします。
    • ワークフローでデータ値を使用しない場合、RICOH ProcessDirector 文書プロパティーとしてデータ値の見出しを定義する必要はありません。この例では、AgentRegionおよびAgentCodeRICOH ProcessDirector 文書プロパティーとして定義しません。

  • 値を DPF に追加する文書プロパティーのデータベース名をリストするヘッダーファイルを作成します。データベースプロパティー名は、それぞれ別の行で指定します。

    例えば、次の内容で headers.txt ファイルを作成します。

    Doc.Custom.AgentNameDoc.Custom.AgentPhoneDoc.Custom.AgentEmail

    この例でワークフロー内のIdentifyPDFDocumentsステップがファイルのセットを処理するとき、このステップは書面と補助入力ファイルから抽出したデータで文書プロパティーファイルを作成します。例えば、会社は[PDF 制御ファイルの識別]で、書面内のカスタマー名と顧客メールアドレスデータを文書プロパティーにマップしています。 IdentifyPDFDocumentsステップは、以下の値で DPF を作成します。

    Doc.Custom.CustomerName Doc.EmailAddress       Doc.Custom.AgentNameDoc.Custom.AgentPhone Doc.Custom.AgentEmailChris Smith            chris.smith@myisp.com  Kelly Lopez1-800-555-1234        kelly.lopez@insurancebiz.com

PDF 文書とデータを含むファイルのセットを処理するようにセットアップするには、次の手順に従います。
  1. 管理タブをクリックします。
  2. 左のペインで装置 入力装置をクリックします。
  3. ホットフォルダー入力装置を追加またはコピーします。

    例えば、追加 ホットフォルダーをクリックして、入力装置に PDFInputFromSetsという名前を付けます。

  4. すべてのタブで、ご使用の環境に適合するように調整する必要のある、必須およびオプションプロパティーを入力します。
  5. 一般タブをクリックします。
  6. 子ワークフロープロパティーの場合、ファイルのセットを処理するために修正するワークフローの名前を選択します。

    例えば、PDFDocumentsFromSetsを選択します。

    新しいワークフローを作成している場合は、デフォルト値を使用します。新しいワークフローを保存した後、入力装置のプロパティーを表示して、このプロパティーの値としてワークフローを選択します。

  7. バッチタブをクリックします。
  8. バッチ方式プロパティーの場合、 セット数セット内のページ数、または 時刻によるセットを選択します。
  9. 選択したバッチ方式に関連付けられたその他のプロパティーの値を指定します。

    例えば、PDF ファイルと CSV ファイルの 50 セットを受信してから、入力装置でバッチ処理を開始し、ファイルをワークフローに実行依頼できます。バッチ対象のファイル数プロパティーに 50 を入力します。

  10. セットの一致パターンプロパティーに値を指定するか、次のデフォルト値を使用します。
    (.+?)\.[^.]*$|$

    デフォルト値は、拡張子を除いた名前が同じファイルを同じセットに追加するように RICOH ProcessDirector に通知します。

    例:

    customer_1.pdfcustomer_1.csv

  11. データパターンプロパティーには、次のように入力します。.*pdf$
  12. 補助入力ファイルを識別するファイルパターンにプロパティー値を入力します。

    例えば、CSV ファイル拡張子が付いた補助入力ファイルに関しては、以下の値を入力します。

    • ファイルパターン.*csv$
    • スプールファイルの使用法auxinput
    • スプールファイルタイプcsv
    • 必須ファイルパターンはい
    • ファイルパターンシーケンス1

    RICOH ProcessDirector では、 スプールファイル使用法プロパティーに、RICOH ProcessDirector のキーワード以外の任意の値を指定できます。キーワードには、controloverrrides、および print があります。

  13. 追加をクリックします。
  14. 入力装置のプロパティー値の入力を完了したら、OKをクリックします。
  15. ワークフロータブをクリックします。
  16. 変更するワークフローを開くか、ワークフローを新規に作成します。

    例えば、用意されているEnhancePDFDocumentsワークフローをコピーして変更します。コピーしたワークフロー PDFDocumentsFromSetsに名前を付けます。

  17. IdentifyPDFDocumentsステップテンプレートに基づいて、ステップを追加または変更します。
  18. IdentifyPDFDocumentsステップのプロパティー値を設定します。
    1. PDF 制御ファイルの識別プロパティーに、RICOH ProcessDirector Plug-in for Adobe Acrobat を使用して作成した制御ファイルの完全パスまたはシンボル名を指定します。

      [PDF 制御ファイルの識別]のデフォルト値は、各 PDF ファイルを 1 つの文書として定義します。次の場合、RICOH ProcessDirector Plug-in for Adobe Acrobat を使用してカスタム制御ファイルを作成します。

      • PDF ファイルに複数の文書が含まれている。
      • 文書にマークアップを追加したい。
      • 文書内のデータを文書プロパティーにマップしたい。

    2. 補助入力ファイル拡張子プロパティーに、補助入力ファイルのファイル拡張子を入力します。

      この値が、入力装置で定義した補助入力ファイルパターンのスプールファイルタイププロパティー値と一致していることを確認します。

      この例では、補助入力ファイルの拡張子は CSV になっています。次のように入力します。csv

    3. ヘッダーファイルプロパティーに、補助入力ファイルから DPF にコピーする値をリストするファイルの完全パスまたは名前を入力します。

      例えば、/aiw/aiw1/aux_input/headers.txt(Linux) またはC:\aiw\aiw1\aux_input\headers.txt(Windows) を入力します。

  19. 必要に応じてワークフローにその他の変更を加えます。
  20. ワークフローを保存します。
  21. 入力装置とワークフローをテストします。
    1. ワークフローを使用可能にします。
    2. ワークフローにジョブを送信する入力装置を有効にし、接続します。
    3. PDF ファイルと CSV ファイルのセットを入力装置に実行依頼します。制限値に達すると、入力装置は、ファイルをバッチ処理してワークフローに実行依頼します。
      この例の入力装置は、50 セットの PDF ファイルと CSV ファイルを実行依頼します。
IdentifyPDFDocumentsステップを実行すると、以下のような出力が生成されます。
  • すべてのセットから取得された全文書が含まれている、1 個の PDF ファイル。
  • ファイルの各セットのサブディレクトリーが入っている、1 個の sets ディレクトリー。
  • [PDF 制御ファイルの識別]で文書プロパティーにマップされたデータの値、および補助入力ファイルから取得したデータの値が含まれる文書プロパティーファイル。