複数の文書プロパティーを定義する
- 注意:
- RICOH ProcessDirector 機能を最大限に活用できるように、文書プロパティーの概要セクションを参照して、文書プロパティーを RICOH ProcessDirector で使用する方法を確認してください。
- PDFファイルをAdobe Acrobat Professionalで開いて、ページグループ定義を含む制御ファイルを読み込むか、ページグループを定義します。
- キャプチャーするデータのブロックの左上隅の少し上の部分をクリックします。マウスをドラッグしてデータのブロックを囲むボックスを描画します。後で抽出された値を表示して、選択を確認できます。
- 注意:
- ボックスは、PDF ファイル内のほとんどのデータ行のうち、最も長い行をキャプチャーすることが可能な十分な大きさにしてください。PDF ファイル内の一部の文字には、文字の間隔を空けるために、他の文字よりも空白領域を大きく使用するものもあります。例えば、大文字のアルファベットまたはその行を取り込む場合、その大文字の左側に、最大 10 分の 1 インチの空白領域を確保する必要があります。
- ポップアップメニューから複数プロパティーの定義を選択します。
- 複数の文書プロパティーのブロックの名前を入力します。名前には、スペースや特殊文字 (@、#、$、%、- (ハイフン) など) を使用しないでください。ピリオドとアンダースコアは使用できます。
- 値を抽出するデータの種類を定義します。
- テキストのみを含む領域を選択した場合は、選択元から テキストを選択します。
- バーコードのみを含む領域を選択した場合は、選択元から バーコードイメージを選択します。
- テキストとバーコードの両方を含む領域を選択した場合は、テキストおよび バーコードイメージの両方を選択します。
テキストデータは抽出された文字列内のバーコードデータの前に配置され、テキストデータの終了位置およびバーコードデータの開始位置が示されません。
- 文書プロパティーデータを抽出する各文書内のページを指定します。次のいずれかの手順を実行します。
- 規則に基づいたページ数を選択して、リストから規則を選択します。デフォルトの規則は、 先頭のフロントページのみです。次のことを行うこともできます。
- 新しい規則を定義するには、アイコンをクリックします。
- 規則マネジャーに移動するには、アイコンをクリックします。
- 重要:
- 最後のバックページのみ、 最後のフロントページのみ、および 最後のページのみ規則は、文書プロパティーデータの抽出では使用できません。
- 特定のページ数を選択し、必要な各文書内のページを入力します。
複数のページを指定した場合は、RICOH ProcessDirector Plug-in for Adobe Acrobat によって、各文書内の最後に指定したページから文書プロパティーデータが抽出されます。例:
- ページ2–4を指定します。文書に4つ以上のページがある場合は、4ページ目から文書プロパティーデータが抽出されます。文書に3つのページがある場合、文書プロパティーデータは3ページ目から抽出されます。文書に2つのページがある場合は、2ページ目から文書プロパティーデータが抽出されます。
- ページ2,4を指定します。文書に4つ以上のページがある場合は、4ページ目から文書プロパティーデータが抽出されます。文書に2 ~ 3ページがある場合は、2ページ目から文書プロパティーデータが抽出されます。
- ページ2–nを指定します。nは最後のページを表すので、文書が 2 ページ以上の場合は、最後のページから文書プロパティーデータが抽出されます。
- 重要:
- nページ のみを指定した場合は、RICOH ProcessDirector Plug-in for Adobe Acrobatは、文書のどのページからも文書プロパティーデータを抽出しません。
- 規則に基づいたページ数を選択して、リストから規則を選択します。デフォルトの規則は、 先頭のフロントページのみです。次のことを行うこともできます。
- 定義ウィンドウの[文書プロパティー]セクションを使用して、文書プロパティーを選択し、プロパティー抽出規則を定義します。このセクションには、選択したテキストの第 1
行の完全なテキストデータが含まれます。既存のテキストブロックの編集を選択すると、このセクションには、テキストブロックに対して定義したすべての文書プロパティーが含まれます。新しい文書プロパティーとそれに関連する変更子抽出規則を定義するには、次の手順に従います。
- 追加アイコン () をクリックして新しい文書プロパティー定義行を追加します。
- プロパティーリストからRICOH ProcessDirector文書プロパティーを選択します。文書プロパティー名を入力して、独自の文書プロパティーを定義できますが、その文書プロパティーは RICOH ProcessDirector では使用できません。独自の文書プロパティーを定義するのは、RICOH ProcessDirector Plug-in for Adobe Acrobatを使用して文書プロパティー値をテキストファイルにエクスポートする場合に限定してください。
- 選択した文書プロパティーの抽出元として、テキストブロックの特定の行を行で選択します。トップダウンまたはボトムアップの参照を使用して、行を選択できます。トップダウンの参照を使用して行を選択するには、 1~ nを選択します ( n は正の整数です)。ボトムアップの参照を選択するには、 最終または最終 - x(x は最終行よりも何行前かを示します) を選択します。リストから行の値を選択する代わりに、行番号を直接 行フィールドに入力できます。
- テキストの変更ウィンドウを表示するには、編集アイコン()を選択します。このウィンドウでは、必要とされる正確な文書プロパティーを抽出するために、1 つ以上の変更子抽出規則を定義します。
- 次の変更子のいずれかを選択します。
コンテンツ変更子
変更者 アクション 文字の削除 値から削除する 1 文字またはブランク文字 (ブランク文字を入力するときはスペースバーを使用します) を入力します。大文字と小文字は区別されます。次に、次のいずれかのボタンを選択します。 - 文字のすべてのインスタンスの削除
指定の文字が値のすべての位置から削除されます。
例えば、顧客番号が324-1443255-11だとします。「-」を入力した場合、値からすべての「-」文字が削除され、324144325511 となります。
- 先行文字の削除
指定の文字が値の先頭から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の先頭から削除されます。
- 末尾文字の削除
指定の文字が値の末尾から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の末尾から削除されます。
- 先行文字と末尾の文字を削除
指定の文字が値の先頭と末尾から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の先頭と末尾から削除されます。
位置によるサブ文字列 開始位置リストから 行の先頭または 行の末尾を選択します。テキスト値の最初の文字の位置を示すために、 最初の位置に数値を指定します。保持する文字数を示すために、 保持する数に数値を指定します。 区切り文字によるサブ文字列 テキスト値が別々の文字列セグメントに分割される位置を示すために、区切り文字フィールドに文字またはブランク文字を入力します。文字とテキスト文字列では、大文字と小文字が区別されます。 開始位置ドロップダウンメニューから 行の先頭または 行の末尾を選択します。
テキスト文字列内での区切り文字の位置を定義するために、最初の位置に数値を指定します。
保持するテキスト文字列セグメントの数を定義するために、保持する数に数値を指定します。
これらの例では、区切り文字を指定することによってテキストセグメントを選択する方法を示しています。
-
アカウント番号 324-1443255-11 の場合、- を区切り文字として使用して、値を 3 つのテキストの324、1443255、11に分割できます。 行の先頭をクリックします。2 番目と 3 番目のテキスト文字列 (1443255、11) を選択する場合、 最初の位置と 保持する数の両方で 2を選択します。
-
郵送先住所 Eldorado Springs CO 80025 の場合、ブランク文字を区切り文字として使用して値を 4 つのテキストのEldorado、Springs、CO、80025に分割できます。 行の末尾を選択します。
-
郵便番号を選択するには、最初の位置と 保持する数の両方で 1 を選択します。
-
状態を選択するには、最初の位置で 2 を選択し、 保持する数で 1 を選択します。
-
都市を選択するには、最初の位置で 3 を選択し、 保持する数で 10 を選択します。 保持する数で 10 を指定することによって、10 個の単語までの都市名を選択できます。
-
文字を埋め込む パディング位置リストから 行の先頭または 行の末尾を選択します。 埋め込む文字フィールドに埋め込み文字として特定の文字またはブランク文字を入力します。 テキストの最小長を定義するために、最小埋め込みテキスト長フィールドに数値を入力します。テキスト文字列の文字数がこの最小長より短い場合、テキスト文字列の長さが最小長と等しくなるまで埋め込み文字が追加されます。
変更子を使用してテキスト抽出規則を定義すると、[テキストの変更]ウィンドウの一番上にある変更するテキストフィールドには、選択した行と、その行に適用される編集内容が表示されます。変更子の右側にある 変更された値フィールドには、上位にある変更子から受信したテキスト、または 変更するテキストフィールド (最初の変更子を定義している場合) から受信したテキストに変更子が適用された場合の処理結果が表示されます。
- 文字のすべてのインスタンスの削除
- 選択した行から求めている値が抽出されるまで、引き続き変更子を適用していきます。新変更子を追加するには、アイコンをクリックします。変更子リストの下にある 最終テキストフィールドには、すべての変更子抽出規則が適用された後、最終的に変更された値が表示されます。ウィンドウの一番下にある変更対象のイニシャル文字フィールドには、選択した変更子に対して、変更子が適用される前の値が表示されます。 変更されたテキストフィールドには、変更子が適用された後の値が表示されます。
- ウィンドウの上部にある変更子管理アイコンを使用して、変更子抽出規則を削除したり、適用の順番を変更したりします。選択した変更子抽出器を削除するには、を使用します。規則の順序を変更するには、上下の矢印アイコンを使用します。規則は上から下に順番に行に適用されます。
- 行の抽出規則を保存するには、OKボタンをクリックします。
- 引き続き、ブロック内の行から抽出する必要があるその他の文書プロパティーを定義します。別の文書プロパティーで使用している同じ行を選択できます。文書プロパティーを削除する必要がある場合、または文書プロパティーの順序を変更する場合は、文書プロパティーの前にあるチェックボックスをオンにして、アイコンと上下矢印アイコンを使用します。
- 文書プロパティーの定義が完了したら、OKをクリックします。
- をクリックして、プロパティーに目的のコンテンツが含まれていることを確認します。
- オプション: ボックスをダブルクリックするか、ボックスを右クリックして編集を選択して、テキストブロックの定義を編集できます。
- 新しい文書プロパティー定義を含む、すべての拡張を PDF ファイルに保存する準備が整ったら、 をクリックします。
- 制御ファイルをRICOH ProcessDirectorサーバーが使用しているディレクトリーに移動して、RICOH ProcessDirector IdentifyPDFDocumentsステップに、この制御ファイルの名前と場所を含めます。この制御ファイルには、このステップで処理される PDF ファイル内の文書を定義するページグループ定義も含める必要があります。