Configurando para processar conjuntos de arquivos contendo dados e documentos PDF

Para processar conjuntos de arquivos contendo um ou mais documentos de um arquivo PDF e dados adicionais em um arquivo de entrada auxiliar, configure um dispositivo de entrada que use um dos métodos em lote para conjuntos: Número de conjuntos, Páginas em conjuntos ou Conjuntos por hora. Em seguida, configure um fluxo de trabalho PDF. Quando executada, a etapa IdentifyPDFDocuments produz uma única tarefa PDF que contém todos os documentos individuais. A etapa inclui os dados adicionais no arquivo de propriedades do documento (DPF) para uso por outras etapas do fluxo de trabalho.
A etapa usa duas propriedades para identificar dados adicionais:
  • O valor da propriedade Extensão do arquivo de entrada auxiliar identifica o arquivo que contém os dados.
  • O valor da propriedadeArquivo de cabeçalhos identifica o arquivo que especifica quais dados no arquivo de entrada auxiliar deverão ser adicionados ao DPF.

Esse procedimento usa um exemplo que mostra como processar conjuntos de arquivos contendo dados e documentos PDF.

  • No exemplo, uma empresa de seguros usa um aplicativo para produzir cartas para os clientes. Cada carta é enviada em arquivos PDF distintos. As cartas produzidas pelo aplicativo não contêm o nome, número de telefone e endereço de e-mail do agente do cliente.
  • Outro aplicativo produz arquivos separados por vírgulas (CSV) com as informações do agente e outros dados que ajudam a empresa a compor e distribuir as cartas. Os dois aplicativos enviam 100 pares de arquivos ao mesmo tempo.
  • Para otimizar o processamento das cartas e adicionar as informações de contato dos agentes, a empresa organiza lotes de 50 cartas em uma única tarefa PDF com os 50 arquivos CSV necessários para leitura dos dados do agente no DPF usado pelas demais etapas do fluxo de trabalho.

Antes de configurar um fluxo de trabalho e um dispositivo de entrada:

  • Certifique-se de que o arquivo de entrada auxiliar atenda a estes requisitos:
    • A linha de cabeçalho contém os nomes de banco de dados das propriedades do documento, separados por vírgulas, de cada valor de dados que você deseja adicionar ao arquivo de propriedades do documento.
    • O arquivo contém uma linha de dados para cada documento do arquivo PDF associado.
    • Em cada linha de dados, os valores das propriedades do documento são separados por vírgulas.

    Por exemplo, o arquivo de entrada auxiliar está associado a um arquivo PDF que contém um único documento. O arquivo contém uma linha de cabeçalho e uma linha de dados com cinco valores de dados:

    Doc.Custom.AgentName,Doc.Custom.AgentPhone,Doc.Custom.AgentEmail,Region,AgentCodeKelly Lopez,1-800-555-1234,kelly.lopez@insurancebiz.com,Southeast,B475

  • Certifique-se de que os cabeçalhos de todos os valores de dados que você deseja usar no fluxo de trabalho estejam definidos como propriedades do documento RICOH ProcessDirector.

    No exemplo, você pretende usar os valores de Doc.Custom.AgentName, Doc.Custom.AgentPhone e Doc.Custom.AgentEmail em uma etapa baseada no modelo de etapa EmailDocuments.

    Defina Doc.Custom.AgentName, Doc.Custom.AgentPhone e Doc.Custom.AgentEmail como propriedades personalizadas do documento.

      Obs.:
    • Recomendamos que os nomes das propriedades de documento personalizadas comecem com Doc.Custom.
    • Se você não quiser usar um valor de dados no fluxo de trabalho, não é preciso definir o cabeçalho do valor de dados como uma propriedade do documento RICOH ProcessDirector. No exemplo, você não define AgentRegion e AgentCode como propriedades do documento do RICOH ProcessDirector.

  • Crie um arquivo de cabeçalhos que liste os nomes de bancos de dados das propriedades do documento cujos valores deseja adicionar ao DPF. Cada nome de propriedade do banco ocupa uma linha separada.

    Por exemplo, crie um arquivo headers.txt com este conteúdo:

    Doc.Custom.AgentNameDoc.Custom.AgentPhoneDoc.Custom.AgentEmail

    Quando a etapa IdentifyPDFDocuments em seu fluxo de trabalho processa o conjunto de arquivos do exemplo, é criado um arquivo de propriedades do documento com dados extraídos da carta e dados do arquivo de entrada auxiliar. Por exemplo, a empresa mapeou o nome e os dados de endereço de e-mail do cliente contidos na carta em propriedades do documento na propriedade Identificar arquivo de controle do PDF. A etapa IdentifyPDFDocuments cria um DPF com estes valores:

    Doc.Custom.CustomerName Doc.EmailAddress       Doc.Custom.AgentNameDoc.Custom.AgentPhone Doc.Custom.AgentEmailChris Smith            chris.smith@myisp.com  Kelly Lopez1-800-555-1234        kelly.lopez@insurancebiz.com

Para configurar para processar conjuntos de arquivos contendo dados e documentos PDF:
  1. Clique na guia Administração.
  2. Na área de janela à esquerda, clique em Dispositivos Dispositivos de Entrada.
  3. Inclua ou copie um dispositivo de entrada Hot Folder.

    Por exemplo, clique em Adicionar Hot Folder e nomeie o dispositivo de entrada PDFInputFromSets.

  4. Em todas as guias, preencha as propriedades obrigatórias e opcionais que precisam ser ajustadas para corresponder ao seu ambiente.
  5. Clique na guia Geral.
  6. Para a propriedade Fluxo de trabalho filho, selecione o nome do fluxo de trabalho que está modificando para processar conjuntos de arquivos.

    Por exemplo, selecione PDFDocumentsFromSets.

    Se estiver criando um novo fluxo de trabalho, use o valor padrão. Após salvar o novo fluxo de trabalho, exiba as propriedades do dispositivo de entrada e selecione o fluxo de trabalho como o valor desta propriedade.

  7. Clique na guia Em lote.
  8. Para a propriedade Método em lote, selecione Número de conjuntos, Páginas em conjuntos ou Conjuntos por hora.
  9. Especifique os valores das demais propriedades associadas usando o método em lote selecionado.

    Por exemplo, suponha que sua intenção seja fazer com que o dispositivo de entrada crie lotes e envie arquivos para o fluxo de trabalho após receber 50 conjuntos de arquivos PDF e CSV. Para a propriedade Número de arquivos para lote, digite 50.

  10. Especifique um valor para a propriedade Cadeia de correspondência para conjuntos ou use o valor padrão:
    (.+?)\.[^.]*$|$

    O valor padrão informa RICOH ProcessDirector para incluir arquivos cujos nomes sejam idênticos, exceto por suas extensões, ao mesmo conjunto.

    Por exemplo:

    customer_1.pdfcustomer_1.csv

  11. Para a propriedade Padrões de dados, insira: .*pdf$
  12. Insira os valores de propriedade para o padrão de arquivo que identifica um arquivo de entrada auxiliar.

    Por exemplo, insira esses valores para um arquivo de entrada auxiliar com a extensão de arquivo CSV:

    • Padrão de arquivo: .*csv$
    • Uso do arquivo de spool: auxinput
    • Tipo de arquivo de spool: csv
    • Modelo de arquivo necessário: Sim
    • Sequência de modelo de arquivo: 1

    RICOH ProcessDirector permite usar qualquer valor para a propriedade Uso do arquivo de spool que não seja uma palavra-chave de RICOH ProcessDirector. As palavras-chave incluem control, overrrides e print.

  13. Clique em Adicionar.
  14. Quando terminar de definir os valores de propriedade para o dispositivo de entrada, clique em OK.
  15. Clique na guia Fluxo de trabalho.
  16. Abra um fluxo de trabalho que deseja modificar ou crie um novo fluxo de trabalho.

    Por exemplo, copie e modifique o fluxo de trabalho fornecido EnhancePDFDocuments. Nomeie o fluxo de trabalho copiado PDFDocumentsFromSets.

  17. Inclua ou modifique uma etapa baseada no modelo de etapa IdentifyPDFDocuments
  18. Defina valores para as propriedades da etapa IdentifyPDFDocuments:
    1. Para a propriedade Identificar arquivo de controle do PDF, especifique o caminho completo ou o nome simbólico do arquivo de controle criado usando Plug-in do RICOH ProcessDirector para Adobe Acrobat.

      O padrão Identificar arquivo de controle do PDF define cada arquivo PDF como um único documento. Use Plug-in do RICOH ProcessDirector para Adobe Acrobat para criar um arquivo de controle personalizado se:

      • Os arquivos PDF contiverem dois ou mais documentos.
      • Você desejar adicionar marcações aos documentos.
      • Você desejar mapear dados nos documentos para as propriedades do documento.

    2. Para a propriedade Extensão do arquivo de entrada auxiliar, insira a extensão de arquivo dos arquivos de entrada auxiliares.

      Certifique-se de que esse valor corresponda ao valor da propriedade Tipo de arquivo de spool para o padrão de arquivo de entrada auxiliar definido no dispositivo de entrada

      No exemplo, o arquivo de entrada auxiliar tem a extensão CSV. Digite: csv

    3. Para a propriedade Arquivo dos cabeçalhos, insira o caminho e o nome completos do arquivo que lista quais valores deverão ser copiados do arquivo de entrada auxiliar para o DPF.

      Por exemplo, insira /aiw/aiw1/aux_input/headers.txt (Linux) ou C:\aiw\aiw1\aux_input\headers.txt (Windows).

  19. Faça outras alterações no fluxo de trabalho conforme necessário.
  20. Salve o fluxo de trabalho.
  21. Teste o dispositivo de entrada e o fluxo de trabalho:
    1. Ative o fluxo de trabalho.
    2. Ative e conecte o dispositivo de entrada que envia tarefas ao fluxo de trabalho.
    3. Envie conjuntos de arquivos PDF e CSV para o dispositivo de entrada até atingir o limite no qual o dispositivo de entrada organiza os arquivos em lotes e os envia ao fluxo de trabalho.
      Para o dispositivo de entrada de exemplo, envie 50 conjuntos de arquivos PDF e CSV.
Quando executada, a etapa IdentifyPDFDocuments gera esta saída:
  • Um único arquivo PDF com todos os documentos de todos os conjuntos.
  • Um diretório sets que contém um subdiretório para cada conjunto de arquivos.
  • Um arquivo de propriedades do documento que contém os valores de quaisquer dados mapeados nas propriedades do documento na propriedade Identificar arquivo de controle do PDF e os valores de dados dos arquivos de entrada auxiliares.