文書プロパティーを定義する
- 注意:
- RICOH ProcessDirector 機能を最大限に活用できるように、文書プロパティーの概要セクションを参照して、文書プロパティーを RICOH ProcessDirector で使用する方法を確認してください。
- PDFファイルをAdobe Acrobat Professionalで開いて、ページグループ定義を含む制御ファイルを読み込むか、ページグループを定義します。
- キャプチャーするデータの左上隅の少し上の部分を左クリックします。マウスをドラッグしてデータを囲むボックスを描画します。後で抽出された値を表示して、選択を確認できます。
- 注意:
- キャプチャーするデータは、テキスト、または画像としてエンコードされたDataMatrixバーコードです。
- ボックスは、PDF ファイル内の最も長いデータをキャプチャーすることが可能な十分な大きさにしてください。PDF ファイル内の一部の文字には、文字の間隔を空けるために、他の文字よりも空白領域を大きく使用するものもあります。例えば、大文字のアルファベットを取り込む場合、その大文字の左側に、最大 10 分の 1 インチの空白領域を確保する必要があります。
- ポップアップメニューから文書プロパティーの定義を選択します。
- リストからRICOH ProcessDirector文書プロパティーを選択するか、文書プロパティー名をフィールドに入力します。特殊文字 (@、#、$、% 、- (ハイフン) など) やスペースは使用しないでください。RICOH ProcessDirector IdentifyPDFDocumentsステップが失敗する可能性があります。ピリオドとアンダースコアは使用できます。
- 注意:
- 文書プロパティーを定義する場合、文書プロパティーは何度でも定義できます。例えば、PDF ファイルのテキストは変更される可能性があり、さらに 2 つの異なる場所から郵便番号を抽出する必要があると仮定します。プロパティーを抽出するページを指定する条件付き配置規則を、それぞれ異なる規則として定義する限り、郵便番号の文書プロパティーを 2 回定義できます。文書内で 2 つの方法で同じ文書プロパティーを定義して、両者の条件が満たされた場合、最後に抽出された値が使用されます。
- 値を抽出するデータの種類を定義します。
- テキストのみを含む領域を選択した場合は、選択元から テキストを選択します。
- バーコードのみを含む領域を選択した場合は、選択元から バーコードイメージを選択します。
- テキストとバーコードの両方を含む領域を選択した場合は、テキストおよび バーコードイメージの両方を選択します。
テキストデータは抽出された文字列内のバーコードデータの前に配置され、テキストデータの終了位置およびバーコードデータの開始位置が示されません。
- 注意:
- 黒いバーコードを使用することをお勧めします。色付きのバーコードを使用すると、想定外の結果が生じることがあります。
- 文書プロパティーデータを抽出する各文書内のページを指定します。次のいずれかを行ってください。
- 規則に基づいたページ数を選択して、ドロップダウンリストから規則を選択します。デフォルトの規則は、 先頭のフロントページのみです。次のことを行うこともできます。
- 新しい規則を定義するには、アイコンをクリックします。
- 規則マネジャーに移動するには、アイコンをクリックします。
- 重要:
- 最後のバックページのみ、 最後のフロントページのみ、および 最後のページのみ規則は、文書プロパティーデータの抽出では使用できません。
- 特定のページ数を選択し、必要な各文書内のページを入力します。
複数のページを指定した場合は、RICOH ProcessDirector Plug-in for Adobe Acrobat によって、各文書内の最後に指定したページから文書プロパティーデータが抽出されます。例:
- ページ2–4を指定します。文書に4つ以上のページがある場合は、4ページ目から文書プロパティーデータが抽出されます。文書に3つのページがある場合、文書プロパティーデータは3ページ目から抽出されます。文書に2つのページがある場合は、2ページ目から文書プロパティーデータが抽出されます。
- ページ2,4を指定します。文書に4つ以上のページがある場合は、4ページ目から文書プロパティーデータが抽出されます。文書に2 ~ 3ページがある場合は、2ページ目から文書プロパティーデータが抽出されます。
- ページ2–nを指定します。nは最後のページを表すので、文書が 2 ページ以上の場合は、最後のページから文書プロパティーデータが抽出されます。
- 重要:
- nページ のみを指定した場合は、RICOH ProcessDirector Plug-in for Adobe Acrobatは、文書のどのページからも文書プロパティーデータを抽出しません。
- 規則に基づいたページ数を選択して、ドロップダウンリストから規則を選択します。デフォルトの規則は、 先頭のフロントページのみです。次のことを行うこともできます。
- オプション: [テキストの変更]ウィンドウを表示するには、編集アイコン () を選択します。このウィンドウでは、必要とされる正確な文書プロパティーを抽出するために、1 つ以上の変更子抽出規則を定義します。
- 次の変更子のいずれかを選択します。
コンテンツ変更子
変更者 アクション 文字の削除 値から削除する 1 文字またはブランク文字 (ブランク文字を入力するときはスペースバーを使用します) を入力します。大文字と小文字は区別されます。次に、次のいずれかのボタンを選択します。 - 文字のすべてのインスタンスの削除
指定の文字が値のすべての位置から削除されます。
例えば、顧客番号が324-1443255-11だとします。「-」を入力した場合、値からすべての「-」文字が削除され、324144325511 となります。
- 先行文字の削除
指定の文字が値の先頭から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の先頭から削除されます。
- 末尾文字の削除
指定の文字が値の末尾から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の末尾から削除されます。
- 先行文字と末尾の文字を削除
指定の文字が値の先頭と末尾から削除されます。例えば、ブランク文字を入力した場合、すべてのブランク文字が値の先頭と末尾から削除されます。
位置によるサブ文字列 開始位置リストから 行の先頭または 行の末尾を選択します。テキスト値の最初の文字の位置を示すために、 最初の位置に数値を指定します。保持する文字数を示すために、 保持する数に数値を指定します。 区切り文字によるサブ文字列 テキスト値が別々の文字列セグメントに分割される位置を示すために、区切り文字フィールドに文字またはブランク文字を入力します。文字とテキスト文字列では、大文字と小文字が区別されます。 開始位置ドロップダウンメニューから 行の先頭または 行の末尾を選択します。
テキスト文字列内での区切り文字の位置を定義するために、最初の位置に数値を指定します。
保持するテキスト文字列セグメントの数を定義するために、保持する数に数値を指定します。
これらの例では、区切り文字を指定することによってテキストセグメントを選択する方法を示しています。
-
アカウント番号 324-1443255-11 の場合、- を区切り文字として使用して、値を 3 つのテキストの324、1443255、11に分割できます。 行の先頭をクリックします。2 番目と 3 番目のテキスト文字列 (1443255、11) を選択する場合、 最初の位置と 保持する数の両方で 2を選択します。
-
郵送先住所 Eldorado Springs CO 80025 の場合、ブランク文字を区切り文字として使用して値を 4 つのテキストのEldorado、Springs、CO、80025に分割できます。 行の末尾を選択します。
-
郵便番号を選択するには、最初の位置と 保持する数の両方で 1 を選択します。
-
状態を選択するには、最初の位置で 2 を選択し、 保持する数で 1 を選択します。
-
都市を選択するには、最初の位置で 3 を選択し、 保持する数で 10 を選択します。 保持する数で 10 を指定することによって、10 個の単語までの都市名を選択できます。
-
文字を埋め込む パディング位置リストから 行の先頭または 行の末尾を選択します。 埋め込む文字フィールドに埋め込み文字として特定の文字またはブランク文字を入力します。 テキストの最小長を定義するために、最小埋め込みテキスト長フィールドに数値を入力します。テキスト文字列の文字数がこの最小長より短い場合、テキスト文字列の長さが最小長と等しくなるまで埋め込み文字が追加されます。
変更子を使用してテキスト抽出規則を定義すると、[テキストの変更]ウィンドウの一番上にある変更するテキストフィールドには、選択した行と、その行に適用される編集内容が表示されます。変更子の右側にある 変更された値フィールドには、上位にある変更子から受信したテキスト、または 変更するテキストフィールド (最初の変更子を定義している場合) から受信したテキストに変更子が適用された場合の処理結果が表示されます。
- 文字のすべてのインスタンスの削除
- 選択した行から求めている値が抽出されるまで、引き続き変更子を適用していきます。新変更子を追加するには、アイコンをクリックします。変更子リストの下にある 最終テキストフィールドには、すべての変更子抽出規則が適用された後、最終的に変更された値が表示されます。ウィンドウの一番下にある変更対象のイニシャル文字フィールドには、選択した変更子に対して、変更子が適用される前の値が表示されます。 変更されたテキストフィールドには、変更子が適用された後の値が表示されます。
- ウィンドウの上部にある変更子管理アイコンを使用して、変更子抽出規則を削除したり、適用の順番を変更したりします。選択した変更子抽出器を削除するには、を使用します。規則の順序を変更するには、上下の矢印アイコンを使用します。規則は上から下に順番に行に適用されます。
- 行の抽出規則を保存するには、OKボタンをクリックします。
- 次の変更子のいずれかを選択します。
- OKをクリックして、文書プロパティーを作成します。
- RICOH ProcessDirector Plug-in for Adobe Acrobat が各文書の正しい文書プロパティー値を抽出していることを確認します。 をクリックし、PDF ファイル内でいくつかの文書をスクロールして、
- 新しい文書プロパティー定義を含む、すべての拡張を PDF ファイルに保存する準備が整ったら、 をクリックします。
- RICOH ProcessDirector IdentifyPDFDocumentsステップで、文書プロパティー定義を含む制御ファイルの名前と場所を指定します。