Doc produitsMenu

Plug-ins de rendement prédéfinis d'Analytique de texte

Une étape de rendement complète le pipeline d'analytique de texte en envoyant l'information extraite vers le rendement désiré.

Note : Vous pouvez créer un pipeline sans étape de rendement afin d'évaluer des journaux du processus sans avoir à enregistrer des résultats.

CESITaggerOutputter

Le plug-in CESITaggerOutputter est le module qui est utilisé afin de sauvegarder le résultat du pipeline d'analytique de texte dans l'index unifié Coveo à l'aide du mécanisme d'étiquetage. Ce plug-in de rendement sauvegarde les valeurs de métadonnées extraites par le pipeline d'analytique de texte pour les documents traités dans les champs d'étiquetage. S'il n'existe pas déjà dans l'index, un champ d'étiquetage est automatiquement créé et nommé en concaténant le préfixe spécifié avec le nom des métadonnées. Vous pouvez, si vous le désirez, supprimer tous les champs d'étiquetage ou certains d'entre eux afin de veiller à ce que le rendement du pipeline actuel remplace les valeurs existantes plutôt que d'être annexé à ces valeurs.

Exemple : Avec la définition suivante de plug-in de rendement, dans l'index unifié Coveo, les valeurs des champs d'étiquetage @txtantheme, @txtancompany, @txtanperson, et @txtanplace sont supprimées pour tous les documents traités et les métadonnées extraites par ce pipeline sont associées à des documents traités dans les champs d'étiquetage correspondants.

<Outputter>
  <Impl>Coveo.TextAnalytics.Implementations.CESITaggerOutputter, Coveo.TextAnalytics.Implementations</Impl>
  <Configuration>
    <TagNamePrefix>@TXTAN</TagNamePrefix>
    <ClearAllTextAnalyticsTags>False</ClearAllTextAnalyticsTags>
    <!-- Clear specified tag fields. Enter the tag field name, not the metadata name. -->
    <ClearTagField>@txtantheme</ClearTagField>
    <ClearTagField>@txtancompany</ClearTagField>
    <ClearTagField>@txtanperson</ClearTagField>
    <ClearTagField>@txtanplace</ClearTagField>
    <!-- Following parameters automatically filled when created from templates using TAnGO -->
    <CertificatePath>D:\CES7\Config\Certificates\cert-iis.p12</CertificatePath> 
    <TagFieldCreatorName>MyDomain\MyTextAnalyticsAccount</TagFieldCreatorName>
    <TagFieldCreatorPassword Encrypted="True">dQxhR3dFtSuC4UZbDyE3Dw==</TagFieldCreatorPassword>
  </Configuration>
</Outputter>

Les paramètres disponibles sont :

<TagNamePrefix>

Ce paramètre obligatoire spécifie le préfixe concaténé aux noms de métadonnées afin de générer des noms de champs d'étiquetage. Le préfixe ne peut inclure que des caractères alphanumériques.

Exemple : Avec <TagNamePrefix>@TXTAN</TagNamePrefix>, les valeurs de métadonnées Theme sont injectées dans l'index unifié dans le champ d'étiquetage @txtantheme.

<ClearAllTextAnalyticsTags>

Définissez ce paramètre facultatif à True afin de supprimer toutes les valeurs de champs d'étiquetage dont les noms commencent par le préfixe qui est spécifié dans le paramètre <TagNamePrefix>. La valeur par défaut est False.

Important : Faites attention : le paramètre <ClearAllTextAnalyticsTags> supprimera les valeurs créées par d'autres mises en marche et tâches pour les champs d'étiquetage dont les noms débutent par la valeur qui est spécifiée dans le paramètre <TagNamePrefix>.

Exemple : Si vous avez une première mise en marche dont le paramètre <TagNamePrefix> est défini à TXTAN2 et une deuxième mise en marche qui est définie à TXTAN, parce que TXTAN est un sous-groupe de TXTAN2, définir <ClearAllTextAnalyticsTags> à True dans la deuxième mise en marche supprime les valeurs de champ d'étiquetage produites par la première mise en marche!

<ClearTagField>

Ce paramètre facultatif supprime les valeurs du champ d'étiquetage spécifié. Vous pouvez spécifier plusieurs instances de ce paramètre.

<TagFieldCreatorName>
<TagFieldCreatorPassword>

Ces paramètres obligatoires contiennent le nom d'utilisateur et le mot de passe d'un utilisateur qui possède des permissions de créer des champs d'étiquetage dans l'index unifié Coveo.

Note : Ces paramètres seront automatiquement remplis par des valeurs par défaut (encodées pour le mot de passe) pendant la création de vos fichiers de configuration du pipeline à partir de TAnGO à l'aide d'un modèle (voir Création d'une mise en marche ou d'une tâche personnalisée à partir d'un modèle).

<TagFieldCreatorSecurityProvider>

Ce paramètre facultatif spécifie le fournisseur de sécurité où l'utilisateur qui est spécifié dans le paramètre <TagFieldCreatorName> est défini. La valeur par défaut est Active Directory.

<TagFieldSIDName>

Ce paramètre facultatif spécifie l'identificateur de sécurité du champ d'étiquetage à utiliser afin de spécifier qui a la permission de voir le contenu de ce champ d'étiquetage. Ce paramètre vous permet de restreindre l'accès au contenu d'un champ d'étiquetage à un utilisateur ou groupe d'utilisateurs spécifique. La valeur par défaut est S-1-1-0 (Tous).

<TagFieldSIDType>

Ce paramètre facultatif spécifie le type de l'identificateur de sécurité du champ d'étiquetage à utiliser afin de spécifier qui a la permission de voir le contenu de ce champ d'étiquetage. La valeur par défaut est Unknown car tout le monde est la valeur <TagFieldSIDName> par défaut. D'autres valeurs valides sont User et Group.

<TagFieldSIDSecurityProvider>

Ce paramètre facultatif spécifie le fournisseur de sécurité où l'identificateur de sécurité qui est spécifié dans le paramètre <TagFieldSIDName> est défini. La valeur par défaut est Active Directory.

Note : Une mise en marche arrêtera si le plug-in CESITaggerOutputter rencontre un document qui ne peut être étiqueté dans l'index unifié Coveo. Ceci peut se produire si l'index devient en mode lecture seulement. Une mise en marche continue redémarrera à l'intervalle de temps spécifié et redémarrera là où il était dès que l'index est de retour en mode lecture-écriture.

FSDumpMetadataPrinter

Le plug-in FSDumpMetadataPrinter enregistre des métadonnées spécifiées dans un fichier texte de valeurs séparées par des virgules spécifié. Une ligne est créée dans le fichier pour chaque valeur de métadonnées extraite et apparaît dans le format suivant :

[DocumentID] [DocumentTitle] [MetadataName] [ExtractedMetadataValue]

Ce plug-in de rendement est habituellement utile pour le débogage et l'affinement. Vous pouvez inspecter le fichier afin d'évaluer le rendement exact du pipeline, ce qui identifie des problèmes ainsi que des valeurs de rendement non désirées ou manquantes.

Exemple : Avec la définition suivante de plug-in de rendement, les valeurs extraites des métadonnées Theme, Company, et Person sont sauvegardées dans le fichier C:\Temp\Debug-AllMetadata.csv.

<Outputter>
  <Impl>Coveo.TextAnalytics.Implementations.FSDumpMetadataPrinter, Coveo.TextAnalytics.Implementations</Impl>
  <Configuration>
    <DirectoryPath>C:\Temp\</DirectoryPath>
    <Prefix>Debug</Prefix>
    <WantedField>Theme</WantedField>
    <WantedField>Company</WantedField>
    <WantedField>Person</WantedField>
  </Configuration>
</Outputter>

Paramètres disponibles :

<DirectoryPath>

Ce paramètre obligatoire spécifie le dossier où le fichier CSV (Comma-Separated Values) est enregistré.

<Prefix>

Ce paramètre obligatoire spécifie le préfixe du nom du fichier CSV, complété avec -AllMetadata.csv.

<WantedField>

Au moins une instance de ce paramètre est nécessaire afin de spécifier les métadonnées pour lesquelles des valeurs seront émises. Utilisez une instance de ce paramètre par métadonnée que vous souhaitez émettre.

FSDumpResultProcessor

Le plug-in FSDumpResultProcessor crée un fichier texte par document récupéré. Les fichiers ne contiennent que le contenu récupéré du document, pas les métadonnées originales ou extraites. Les fichiers sont enregistrés dans un dossier spécifié avec un nom de la forme [DocID].txt[DocID] est la valeur du champ @sysrowid du document où le récupérateur CESIQuerierFetcher est utilisé. Autrement, le [DocID] est celui défini par le récupérateur qui est utilisé afin de retrouver des documents. Ce plug-in de rendement est habituellement utile pour le débogage de pipeline afin de valider le contenu qui est extrait par le récupérateur.

Exemple : Avec la définition suivante de plug-in de rendement, le contenu texte récupéré de chaque document traité est enregistré dans le dossier C:\Temp\ dans un fichier nommé selon son [DocID].

<Outputter>
  <Impl>Coveo.TextAnalytics.Implementations.FSDumpResultProcessor, Coveo.TextAnalytics.Implementations</Impl>
  <Configuration>
    <DirectoryPath>C:\Temp\</DirectoryPath>
 </Configuration>
</Outputter>