Doc produitsMenu

Plug-ins de tâches prédéfinis d'Analytique de texte

Une tâche exécute tout simplement un bloc de code. Elle ne fonctionne pas sur un groupe de documents comme une mise en marche. Le bloc de code associé à plusieurs des plug-ins de tâche prédéfinis suivants bénéficie du mécanisme d'étiquetage Coveo afin de permettre des opérations par lots, souvent efficaces, sur les champs d'étiquetage d'analytique de texte.

CreateTagField

Le plug-in CreateTagField crée des champs d'étiquetage spécifiés dans l'index. Contrairement aux plug-ins de rendement de mises en marche, les tâches ne peuvent créer automatiquement les champs d'étiquetage correspondant aux noms de métadonnées extraites, car elles ne font pas partie d'un pipeline de documents. Vous devez donc exécuter ce plug-in de tâche afin de créer des champs d'étiquetage nécessaires avant d'exécuter des plug-ins de tâches qui enregistrent des valeurs de métadonnées dans ces champs d'étiquetage.

Exemple : La définition de tâche suivante crée les champs d'étiquetage @txtanexample1 et @txtanexample2.

<Job Name="CreateTagFieldExample">
  <Impl>Coveo.TextAnalytics.Implementations.CreateTagFieldJob, Coveo.TextAnalytics.Implementations</Impl>  	  
  <Configuration>
    <CreateTagField>@txtanexample1</CreateTagField>
    <CreateTagField>@txtanexample2</CreateTagField>
    <!-- Create runs from templates using TAnGO to automatically fill the following parameters with default values -->
    <TagFieldCreatorName>MyDomain\MyTextAnalyticsAccount</TagFieldCreatorName>
    <TagFieldCreatorPassword Encrypted="True">bQxhRBprtSuC4UZcDzE3Dw==</TagFieldCreatorPassword>
  </Configuration>
</Job>

ClearFieldJob

Le plug-in ClearFieldJob donne la liste interne de toutes les valeurs retrouvées dans un champ d'étiquetage, puis utilise une requête d'étiquetage pour chaque valeur afin de supprimer les valeurs d'un champ d'étiquetage spécifique pour les documents indexés qui sont retournés par une requête spécifique. Ce plug-in est disponible dans la version 2.0.11+ d'Analytique de texte.

Note : Si le nombre de valeurs de champ d'étiquetage disponibles est élevé, générer la liste peut prendre plusieurs minutes, pendant lesquelles rien n'apparaît dans les journaux de tâches. Puis, les requêtes d'étiquetage pour chaque valeur commencent à apparaître dans les journaux de tâches, supprimant progressivement les valeurs de champ d'étiquetage dans l'index.

Exemple : Avec la définition de tâche suivante, les valeurs du champ d'étiquetage @txtantheme sont supprimées pour tous les documents qui sont retournés par la requête @syslanguage=English.

<Job Name="ClearFieldJob">
  <Impl>Coveo.TextAnalytics.Implementations.ClearFieldJob, Coveo.TextAnalytics.Implementations</Impl>  	
  <Configuration>
    <Name>ClearFieldJob</Name>
    <TagField>@txtantheme</TagField>
    <ScopeQuery>@syslanguage=English</ScopeQuery>
    <CESSearchHost>localhost</CESSearchHost>
    <CESSearchPort>52800</CESSearchPort>
    <CESCertificatePath>D:\CES7\Config\Certificates\cert-iis.p12</CESCertificatePath>	  
    <SuperUserToken>6ca0af68-3749-4c62-8854-8f4b70ba43c5</SuperUserToken>	  
  </Configuration>
</Job>

MasterFieldMoverJob

Le plug-in MasterFieldMoverJob crée un nouveau champ d'étiquetage renfermant les valeurs les plus fréquentes d'un autre champ d'étiquetage. Le but de cette migration est de créer une liste des principaux éléments à partir d'une longue liste de valeurs et d'assigner le champ d'étiquetage de la liste à une facette plutôt qu'à la version originale afin d'empêcher un long chargement de facette. Ce plug-in est disponible dans la version 2.0.11+ d'Analytique de texte.

Exemple : Plusieurs millions de thèmes ont été extraits d'un groupe de documents. Avec la définition de tâche suivante, le champ d'étiquetage @txtanmastertheme est créé et contiendra les 10 000 thèmes les plus fréquents qui sont retrouvés dans le champ d'étiquetage @txtantheme.

<Job Name="MasterFieldMoverJob">
  <Impl>Coveo.TextAnalytics.Implementations.MasterFieldMoverJob, Coveo.TextAnalytics.Implementations</Impl>  	      
  <Configuration>
    <Name>MasterFieldMoverJob</Name>			
    <!-- Leave TagFieldCreatorName empty if you do not want to dynamically create the tag fields -->
    <TagFieldCreatorName></TagFieldCreatorName>
    <!-- If TagFieldCreatorPassword is empty, Coveo.TextAnalytics.Setup will automatically asks for this field value and encrypt it -->
    <TagFieldCreatorPassword Encrypted="True"></TagFieldCreatorPassword>
    <TagField>@txtantheme</TagField>
    <MasterTagField>@txtanmastertheme</MasterTagField>
    <MasterListSize>10000</MasterListSize>	
  </Configuration>
</Job>

BlacklistJob

Le plug-in BlacklistJob utilise les requêtes d'étiquetage afin de supprimer les valeurs de liste noire qui sont définies dans un fichier de texte plat spécifié d'un ou plusieurs champs d'étiquetage spécifiés pour les documents indexés qui sont retournés par une requête spécifiée.

Le format du fichier qui renferme les expressions mises en liste noire est le même que celui pour le normalisateur MetadataBlacklister qui est utilisé dans les étapes de mise en marche afin que vous puissiez partager le fichier entre eux (voir MetadataBlackLister).

Exemple : Avec la définition de tâche suivante, le plug-in BlacklistJob supprime les valeurs qui sont définies dans le fichier D:\TextAnalytics\Config\normalizations\blacklist-example.txt et qui sont retrouvées dans les champs d'étiquetage @txtantheme et @txtanplace pour les documents indexés qui sont retournés par la requête @uri="gov".

<Job Name="BlacklistJobExample">
  <Impl>Coveo.TextAnalytics.Implementations.BlacklistJob, Coveo.TextAnalytics.Implementations</Impl>  	
  <Configuration>
    <Name>BlacklistJobExample</Name>
    <TagField>@TXTANTheme</TagField>
    <TagField>@TXTANPlace</TagField>
    <ScopeQuery>@uri="gov"</ScopeQuery>
    <FilePath>D:\TextAnalytics\Config\normalizations\blacklist-example.txt</FilePath>
  </Configuration>
</Job>

NormalizationJob

Le plug-in NormalizationJob utilise des requêtes d'étiquetage afin de normaliser des valeurs dans un ou plusieurs champs d'étiquetage spécifiés, tel que défini dans un fichier texte plat spécifié pour les documents indexés qui sont retournés par une requête spécifiée.

Le format du fichier renfermant les valeurs de normalisation est le même que celui pour le normalisateur MetadataNormalizer utilisé dans les étapes de mise en marche afin que vous puissiez partager le fichier entre eux (voir MetadataNormalizer).

Exemple : Avec la définition de tâche suivante, le plug-in NormalizationJob homogénéise les valeurs que l'on retrouve dans le champ d'étiquetage @txtantheme à l'aide de valeurs normalisées, définies dans le fichier D:\TextAnalytics\Config\normalizations\normalization-example.txt pour les documents indexés en anglais qui sont retournés par la requête @syslanguage=English.

<Job Name="TestNormalizerJob">
  <Impl>Coveo.TextAnalytics.Implementations.NormalizationJob, Coveo.TextAnalytics.Implementations</Impl>  	
  <Configuration>
    <Name>TestNormalizerJob</Name>
    <TagField>@TXTANTheme</TagField>
    <ScopeQuery>@syslanguage=English</ScopeQuery>
    <FilePath>D:\TextAnalytics\Config\normalizations\normalization-example.txt</FilePath>
  </Configuration>
</Job>

WhitelistBasicMatcherJob

Le plug-in WhitelistBasicMatcherJob utilise des requêtes d'étiquetage afin d'ajouter des valeurs, définies dans un fichier texte plat spécifié, à un champ d'étiquetage spécifié se elles sont retrouvées dans des documents indexés, retournés par une requête spécifiée.

Le format du fichier de liste blanche est identique à celui du plug-in Whitelister qui est utilisé dans les étapes de mise en marche, afin que vous puissiez partager le fichier entre eux (voir Whitelister).

Exemple : Avec la définition de tâche suivante, le plug-in WhitelistBasicMatcherJob ajoute des valeurs, définies dans le fichier D:\TextAnalytics\Config\whitelists\wizards-example.txt, au champ d'étiquetage @txtantheme si elles sont retrouvées dans des documents indexés qui sont retournés par la requête @syslanguage=English.

<Job Name="TestWhitelistBasicMatcherJob">
  <Impl>Coveo.TextAnalytics.Implementations.WhitelistBasicMatcherJob, Coveo.TextAnalytics.Implementations</Impl>  	
  <Configuration>
    <Name>TestWhitelistBasicMatcherJob</Name>
    <TagField>@TXTANTheme</TagField>
    <ScopeQuery>@syslanguage=English</ScopeQuery>
    <FilePath>D:\TextAnalytics\Config\whitelists\wizards-example.txt</FilePath>
  </Configuration>
</Job>

WhitelistQueryMatcherJob

Le plug-in WhitelistQueryMatcherJob lit un fichier texte plat qui spécifie une ou plusieurs requêtes et des valeurs d'étiquetage correspondantes. Le plug-in évalue les documents indexés retournés par rapport aux requêtes, puis, s'il y a une correspondance, ajoute la valeur correspondante au champ d'étiquetage spécifié.

Exemple : Avec la définition de tâche suivante, le plug-in WhitelistQueryMatcherJob lit le fichier query-based-job-example.txt. Si un document contient l'un des mots suivants : cucurbita, squash, pumpkin, courgette, fruits est ajouté au champ d'étiquetage @txtantheme.

<Job Name="TestWhitelistQueryMatcherJob">
  <Impl>Coveo.TextAnalytics.Implementations.WhitelistQueryMatcherJob, Coveo.TextAnalytics.Implementations</Impl>  	
  <Configuration>
    <Name>TestWhitelistQueryMatcherJob</Name>
    <TagField>@TXTANTheme</TagField>
    <ScopeQuery>@syslanguage=English</ScopeQuery>
    <FilePath>D:\TextAnalytics\Config\whitelists\query-based-job-example.txt</FilePath>
  </Configuration>
</Job>

Le fichier query-based-job-example.txt contient :

cucurbita OR squash OR pumpkin OR courgette fruits

Le fichier peut contenir une ou plusieurs requêtes. Chaque requête se trouve sur une ligne, suivie par une valeur de champ d'étiquetage délimitée par une tabulation. Le format de fichier d'est pas compatible avec tout module utilisé pour les mises en marche.

Note : L'expression dans la première colonne du fichier est utilisée telle quelle pour la requête et doit donc être une requête complète et valide, renfermant des caractères entre guillemets si nécessaire.