Exigences relatives à l'AFP indexable
Les zones structurées BNG (Begin Named Group) et ENG (End Named Group) qui existent déjà dans les données AFP en entrée peuvent être reconnues et conservées par AFP Indexer ou supprimées et remplacées par AFP Indexer pour définir un nouveau déclencheur de document.
Si les groupes de pages nommés existants sont conservés, les niveaux d'imbrication à conserver peuvent être sélectionnés lors de la configuration. Le système détermine les documents en se basant sur les groupes de pages nommés les plus externes.
Si des groupes de pages nommés sont conservés, les repères d'indexation existants (TLE) peuvent également être conservés.
Cette section décrit les exigences relatives aux données AFP à transmettre à AFP Indexer.
Exigences et exemples | |
---|---|
AFP valide | Les données AFP doivent être conformes à la référence suivante : Data Stream and Object Architecture : MO:DCA Reference. |
BDT/EDT | Les données AFP peuvent contenir plusieurs paires de zones structurées BDT (Begin
Document) et EDT (End Document), mais celles-ci ne peuvent pas être imbriquées.
Example: BDT ... EDT BDT ... EDT |
Pages – BPG/EPG | Les pages se trouvant avant le début des groupes nommés ne sont pas indexées.
Example: 2 banner pages discarded BDT BPG/EPG BPG/EPG BNG BPG/EPG (1st document) ENG ... EDT |
Groupes de pages nommés existants – BNG/ENG | Des groupes de pages nommés pour les limites de document peuvent exister. Le niveau
d'imbrication est spécifié lorsque vous choisissez de conserver les groupes de pages
nommés existants.
Vous pouvez supprimer des groupes de pages nommés et redéfinir des limites en définissant un nouveau déclencheur de document. Les TLE existants sont supprimés si le déclencheur de document est redéfini. Example: 2 documents BNG (1st document) BNG/../ENG (nesting allowed) BNG/../ENG\ ENG BNG (2nd document) ENG |
Index existants – TLE | Si les groupes de pages nommés sont conservés, les repères d'indexation existants peuvent l'être également. Les repères d'indexation ne peuvent pas se trouver en dehors des limites des groupes de pages nommés existants. |
Déclencheurs de document | Pour ajouter des groupes de pages nommés pour la délimitation de documents, vous devez
définir un déclencheur de document.
La zone de texte AFP doit être située à un emplacement physique (d'impression) constant. En présence de plusieurs zones à cet emplacement, leur ordre doit être respecté. Si une analyse est nécessaire, les règles d'analyse doivent être appliquées de manière homogène au texte du déclencheur de document pour tous les documents du fichier. Seule l'architecture PTOCA (Presentation Text Object Content Architecture) est prise en charge dans une page AFP. Les images AFP, les règles de dessin, les objets Bar Code Object Content Architecture (BCOCA) ou l'architecture PTOCA dans les segments ou les fonds de page ne sont pas pris en charge en tant que déclencheurs de document. Sample document trigger: BPG PTX TRN (full trigger text) EPG |
Repères d'indexation | Les repères d'indexation peuvent être créés à partir du texte AFP ou des enregistrements
NOP (No Operation) provenant des données AFP.
Un enregistrement NOP permet à une application d'accéder à l'instruction suivante pour traiter les informations sans avoir à effectuer une autre opération. Les NOP de groupes de pages se situent hors des pages AFP logiques ; elles font partie de zones structurées qui se trouvent dans le groupe de pages mais pas sur la page en cours. Les enregistrements NOP du fichier AFP ne sont pas visualisables ou imprimables. Vous pouvez cependant créer des repères d'indexation à partir des données que contient RICOH Visual Workbench. Pour créer un repère d'indexation à partir du texte AFP, ce dernier doit se trouver à un emplacement physique (d'impression) constant. En présence de plusieurs blocs de texte à cet emplacement, l'ordre doit être respecté. Si une analyse est nécessaire, les règles d'analyse doivent être appliquées de manière homogène aux données d'indexation pour tous les documents du fichier. Les données de texte de présentation constituent le seul type de données prises en charge en tant que repère d'indexation dans une page AFP. Les images AFP, les règles de dessin, les objets BCOCA ou l'architecture PTOCA dans les segments ou les fonds de page ne sont pas pris en charge en tant que données de repère d'indexation. Exemple de repère d'indexation : BPG PTX TRN (index text here) BPG |