Configuración para procesar conjuntos de archivos que contienen documentos PDF y datos

Para procesar conjuntos de archivos que contienen uno o más documentos en un archivo PDF y datos adicionales en un archivo de entrada auxiliar, configure un dispositivo de entrada que utilice uno de los métodos de proceso por lotes: Número de conjuntos, Páginas en conjuntos o Conjuntos por hora. A continuación, configure un flujo de trabajo PDF. Cuando se ejecuta el paso IdentifyPDFDocuments, genera un único trabajo PDF que contiene todos los documentos individuales. El paso incluye los datos adicionales en el archivo de propiedades del documento (DPF) para su uso por otros pasos en el flujo de trabajo.
El paso utiliza dos propiedades para identificar los datos adicionales:
  • El valor de la propiedad Extensión del archivo de entrada auxiliar identifica el archivo que contiene los datos.
  • El valor de la propiedad Archivo de cabecera identifica el archivo que especifica qué datos en el archivo de entrada auxiliar se añaden al DPF.

El procedimiento utiliza un ejemplo para mostrar cómo procesar conjuntos de archivos que contienen documentos PDF y datos.

  • En el ejemplo, una compañía de seguros utiliza una aplicación para producir cartas para los clientes. Cada carta es un archivo PDF independiente. Las cartas producidas por la aplicación no contienen ni el nombre, ni el número de teléfono, ni la dirección de correo electrónico del agente para el cliente.
  • Una aplicación separada produce archivos separados por coma (CSV) con la información del agente y con otros datos que ayudan a la compañía a componer y direccionar las cartas. Ambas aplicaciones generan 100 pares de archivos al mismo tiempo.
  • Para optimizar el procesamiento de las letras y añadir la información de contacto de los agentes, la compañía procesa 50 cartas en un único trabajo PDF con los 50 archivos CVS necesarios para leer los datos del agente en el DPF que los otros pasos de la corriente de trabajo utilizan.

Antes de configurar un flujo de trabajo y un dispositivo de entrada:

  • Asegúrese de que el archivo de entrada auxiliar cumple con estos requisitos:
    • La línea de la cabecera contiene los nombres de bases de datos de propiedades del documento, separados por comas, para cada valor de los datos que desea añadir al archivo de propiedades del documento.
    • El archivo tiene una línea de datos para cada documento en el archivo PDF asociado.
    • En cada línea de datos, los valores de las propiedades del documento se separan por comas.

    Por ejemplo, este archivo de entrada auxiliar está asociado con un archivo PDF que contiene un documento. El archivo contiene una línea de cabecera y una línea de datos con cinco valores de datos:

    Doc.Custom.AgentName,Doc.Custom.AgentPhone,Doc.Custom.AgentEmail,Region,AgentCode
    Kelly Lopez,1-800-555-1234,kelly.lopez@insurancebiz.com,Southeast,B475

  • Asegúrese de que las cabeceras para todos los valores de datos que desea utilizar en el flujo de trabajo se definen como propiedades del documento RICOH ProcessDirector.

    En el ejemplo, debe utilizar los valores para Doc.Custom.AgentName, Doc.Custom.AgentPhone y Doc.Custom.AgentEmail en un paso basado en la plantilla de pasos EmailDocuments.

    Defina Doc.Custom.AgentName, Doc.Custom.AgentPhone y Doc.Custom.AgentEmail como propiedades del documento personalizadas.

      Nota:
    • Se recomienda que los nombres de las propiedades de documento personalizadas empiecen por Doc.Custom.
    • Si no desea utilizar un valor de datos en el flujo de trabajo, no necesita definir la cabecera del valor de datos como una propiedad de documento RICOH ProcessDirector. En el ejemplo, no se define AgentRegion y AgentCode como propiedades del documento RICOH ProcessDirector.

  • Cree un archivo de cabeceras que enumeren los nombres de bases de datos de las propiedades del documento cuyos valores desea agregar a DPF. Cada nombre de la propiedad de la base de datos está en una línea separada.

    Por ejemplo, crea un archivo headers.txt con este contenido:

    Doc.Custom.AgentName
    Doc.Custom.AgentPhone
    Doc.Custom.AgentEmail

    Cuando el paso IdentifyPDFDocuments en el flujo de trabajo procesa el conjunto de archivos en el ejemplo, se crea un archivo de propiedades del documento con los datos extraídos de la carta y los datos del archivo de entrada auxiliar. Por ejemplo, la compañía ha correlacionado el nombre del cliente y los datos de la dirección de correo electrónico del cliente de la carta con las propiedades del documento con el valor de Identificar archivo de control PDF. El paso IdentifyPDFDocuments crea un DPF con los siguientes valores:

    Doc.Custom.CustomerName Doc.EmailAddress
    Doc.Custom.AgentNameDoc.Custom.AgentPhone Doc.Custom.AgentEmail
    Chris Smith            chris.smith@myisp.com  
    Kelly Lopez1-800-555-1234        kelly.lopez@insurancebiz.com
    

Para configurar para procesar conjuntos de archivos que contienen documentos PDF y datos:
  1. Pulse la pestaña Administración.
  2. En el panel de la izquierda, pulse Dispositivos Dispositivos de entrada.
  3. Añada o copie un dispositivo de entrada de carpeta activa.

    Por ejemplo, pulse Añadir Carpeta activa y denomine el nombre del dispositivo de entrada PDFInputFromSets.

  4. En todas las pestañas, rellene las propiedades obligatorias y opcionales que debe ajustar para que coincidan con el entorno.
  5. Pulse la pestaña General.
  6. Para la propiedad de Flujo de trabajo hijo, seleccione el nombre del flujo de trabajo que está modificando para procesar conjuntos de archivos.

    Por ejemplo, seleccione PDFDocumentsFromSets.

    Si va a crear un nuevo flujo de trabajo, utilice el valor por omisión. Después de guardar el nuevo flujo de trabajo, muestre las propiedades para el dispositivo de entrada y seleccione el flujo de trabajo como el valor de esta propiedad.

  7. Pulse la pestaña Proceso por lotes.
  8. Para la propiedad Método de proceso por lotes seleccione el Número de conjuntos, Páginas en conjuntos o Conjuntos por hora.
  9. Especifique valores para otras propiedades asociadas con el método de proceso por lotes que ha seleccionado.

    Por ejemplo, desea que el dispositivo de entrada procese lotes y someta los archivos al flujo de trabajo después de recibir 50 conjuntos de archivos PDF y archivos CSV. Para la propiedad Número de archivos a procesar por lote introduzca 50.

  10. Especifique un valor para la propiedad Patrón de coincidencia para conjuntos o utilice el valor por omisión:
    (.+?)\.[^.]*$|$

    El valor por omisión dice a RICOH ProcessDirector que añada archivos cuyos nombres son idénticos, excepto por las extensiones del mismo conjunto.

    Por ejemplo:

    customer_1.pdfcustomer_1.csv

  11. Para la propiedad Patrones de datos, introduzca: .*pdf$
  12. Introduzca valores de propiedad para el patrón de archivo que identifica un archivo de salida auxiliar.

    Por ejemplo, escriba estos valores para un archivo de entrada auxiliar con una extensión de archivo CSV:

    • Patrón de archivo: .*csv$
    • Utilización de archivo de spool: auxinput
    • Tipo de archivo de spool: csv
    • Patrón de archivo necesario:
    • Secuencia de patrón de archivos: 1

    RICOH ProcessDirector le permite utilizar cualquier valor para la propiedad Utilización de archivo de spool que no sea una palabra clave de RICOH ProcessDirector. Las palabras clave incluyen control, alteraciones e impresión.

  13. Pulse Añadir.
  14. Cuando termine de establecer los valores de propiedad para el dispositivo de entrada, pulse Aceptar.
  15. Pulse la pestaña Flujo de trabajo.
  16. Abra un flujo de trabajo que desee modificar o cree uno nuevo.

    Por ejemplo, copie y modifique el flujo de trabajo proporcionado EnhancePDFDocuments. Puede nombrar al flujo de trabajo copiado PDFDocumentsFromSets.

  17. Añada o modifique un paso basado en la plantilla de pasos SIdentifyPDFDocuments.
  18. Establezca valores en las propiedades del paso IdentifyPDFDocuments:
    1. Para la propiedad Identificar archivo de control PDF, especifique la vía de acceso completa o el nombre simbólico del archivo de control que creó mediante Plug-in RICOH ProcessDirector para Adobe Acrobat.

      La propiedad Identificar archivo de control PDF por omisión define cada documento PDF como un único documento. Utilice Plug-in RICOH ProcessDirector para Adobe Acrobat para crear un archivo de control personalizado si:

      • El PDF contiene dos o más documentos.
      • Quiere añadir marcas a los documentos.
      • Desea correlacionar datos en los documentos con propiedades del documento.

    2. Para la propiedad Extensión del archivo de entrada auxiliar, introduzca la extensión de archivo de los archivos de entrada auxiliares.

      Asegúrese de que este valor coincide con el valor de la propiedad Tipo de archivo spool para el patrón del archivo de entrada auxiliar que definió en el dispositivo de entrada.

      En el ejemplo, el archivo de entrada auxiliar tiene una extensión CSV. Entre: csv

    3. Para la propiedad Archivo de cabecera, introduzca la vía de acceso completa y el nombre del archivo que enumera qué valores copiar desde el archivo de entrada auxiliar hasta el DPF.

      Por ejemplo, introduzca /aiw/aiw1/aux_input/headers.txt (AIX o Linux) o C:\aiw\aiw1\aux_input\headers.txt (Windows).

  19. Haga otros cambios en el flujo de trabajo, según sea necesario.
  20. Guarde el flujo de trabajo.
  21. Pruebe el dispositivo de entrada y el flujo de trabajo:
    1. Active el flujo de trabajo.
    2. Active y conecte el dispositivo de entrada que envía trabajos al flujo de trabajo.
    3. Someta conjuntos de archivos PDF y archivos CSV para el dispositivo de entrada hasta llegar al límite en el que el dispositivo de entrada procesa los archivos y los somete al flujo de trabajo.
      Por ejemplo, el dispositivo de entrada somete 50 conjuntos de archivos PDF y archivos CSV.
Cuando se ejecuta el paso IdentifyPDFDocuments, se genera este resultado:
  • Un único archivo PDF con todos los documentos de todos los conjuntos.
  • Un directorio de conjuntos que contiene un subdirectorio para cada conjunto de archivos.
  • Un archivo de propiedades del documento que contiene los valores para cualquier dato correlacionado con las propiedades del documento en el valor Identificar archivo de control PDF y los valores de datos de los archivos de entrada auxiliares.