Paramètres globaux de configuration d'Analytique de texte
Paramètres globaux de configuration :
-
<Continuous>
-
Définissez ce paramètre à True afin de lancer la mise en marche à un intervalle de temps régulier spécifié dans le paramètre <SleepBetweenRuns>. Activez le mode en continu si vous souhaitez traiter de nouveaux documents indexés à des intervalles réguliers. Le lancement est annulé si la mise ne marche est déjà active.
-
<SleepBetweenRuns>
-
Ce paramètre spécifie l'intervalle de temps, en millisecondes, entre les mises en marche si le paramètre <continuous> est défini à True. Sélectionnez un intervalle de temps qui est assez long pour veiller à ce qu'une mise en marche incrémentale typique soit complétée dans l'intervalle de temps, et assez court pour veiller à ce que les nouveaux documents indexés soient traités aisément afin de maintenir la fraîcheur des données d'analytique de texte sans gaspiller les ressources de l'unité centrale.
-
<NbThreads>
-
Ce paramètre spécifie le nombre de fils que le pipeline peut utiliser. Utiliser plus d'un fil est particulièrement utile avec des extracteurs intensifs d'unité centrale tels que le
SalienceMetadataExtractor
. Les traitements d'analytique de texte tels que l'extraction de thèmes et d'entités nommées peuvent être exigeants pour l'unité centrale. Sélectionnez le nombre de fils pour qu'il soit égal au nombre de cœurs d'unités centrales que vous pouvez consacrer à l'analytique de texte.
-
<StateDir>
-
Pour les mises en marche seulement, ce paramètre spécifie le dossier où l'état du pipeline est enregistré dans un fichier cookie. Pendant l'utilisation de CESIQuerierFetcher, l'état contient le rowid du dernier document traité. La valeur par défaut est [Text_Analytics_Path]\Config\state\.
-
Pour les mises en marche, ce paramètre est nécessaire afin de spécifier le nom à utiliser pour les métadonnées Themes si le pipeline renferme le plug-in SalienceMetadataExtractor (voir SalienceMetadataExtractor).
-
Pour les mises en marche seulement, ce paramètre est nécessaire afin de spécifier le nom à utiliser pour les métadonnées Sentiment si le pipeline renferme le plug-in SalienceMetadataExtractor (voir SalienceMetadataExtractor).
-
<CESCertificatePath>
-
Ce paramètre spécifie le dossier et le nom de fichier du certificat de recherche Coveo Enterprise Search (CES) valide que le module doit utiliser afin de pouvoir récupérer des documents de l'index unifié. La valeur par défaut est [Index_Path]\Config\Certificates\cert-iis.p12.
Si le module Analytique de texte est installé dans un serveur autre que le serveur maître Coveo, veillez à ce que le chemin d'accès et le nom du fichier correspondent à l'endroit où vous avez copié le fichier (voir Première installation du module Analytique de texte).
Exemple : Si le module Analytiques de texte est installé dans le serveur maître Coveo, le nom par défaut est :
<CESCertificatePath>C:\ces7\Config\Certificates\cert-iis.p12 </CESCertificatePath
-
<CESSearchHost>
-
Ce paramètre spécifie l'adresse du serveur maître Coveo à utiliser pour récupérer et étiqueter des documents indexés. Vous pouvez entrer localhost si le module Analytiques de texte est installé dans le serveur maître Coveo.
-
<CESSearchPort>
-
Ce paramètre spécifie le port à utiliser dans le serveur maître Coveo pour récupérer et étiqueter des documents indexés. La valeur par défaut est 52800 (voir À propos du port de service CES).
-
<SuperUserToken>
-
Ce paramètre spécifie l'identificateur de super-utilisateur que l'utilisateur qui exécute le service Coveo Job Scheduling doit faire passer dans CES afin de pouvoir récupérer tous les documents indexés. Collez l'identificateur de super-utilisateur que vous avez créé (voir Module Analytique de texte - Vue d'ensemble du déploiement).
Exemple : Votre identificateur de super-utilisateur est un identificateur global unique hexadécimal identique à celui-ci : <SuperUserToken>e401b92d-0f40-4b44-a85e-0eb56d9e06c2</SuperUserToken>
-
Ce paramètre spécifie le nombre de documents qui sont récupérés de l'index unifié par le plug-in CESIQuerierFetcher pour chaque lot. La valeur par défaut est 100 et la valeur maximale est 1000. Ce paramètre est disponible dans la version 2.0.11+ d'Analytique de texte.
-
Ce paramètre spécifie le niveau de détails journalisés. La valeur par défaut est All. D'autres options : WarningsAndErrors et ErrorsOnly. Ce paramètre est disponible dans la version 2.0.13+ d'Analytique de texte.
Exemple : L'échantillon suivant d'un fichier de configuration affiche la section de configuration globale telle qu'elle apparaît dans un modèle de mise en marche où les espaces réservés dans le format %%[Parameter value]%% seront remplacés par des valeurs appropriées si vous créez un fichier de configuration de pipeline à l'aide de TAnGO (voir Création d'une mise en marche ou d'une tâche personnalisée à partir d'un modèle).
<?xml version="1.0" encoding="utf-8"?>
<TextAnalyticsService>
<!-- Global configuration parameters -->
<Configuration>
<!-- The run will execute continuously, looking for new documents to process after the first pass is completed. Waits SleepBetweenRuns (in ms) before checking for new results to process -->
<Continuous>True</Continuous>
<FetchBatchSize>100</FetchBatchSize>
<SleepBetweenRuns>30000</SleepBetweenRuns>
<NbThreads>2</NbThreads>
<!-- The name of the metadata for themes -->
<ThemeMetaName>Theme</ThemeMetaName>
<!-- Location of the file used to save the value of the ID of the latest processed document -->
<StateDir>%%TextAnalyticsRootDirectory%%\Config\state</StateDir>
<CESSearchHost>%%CESSearchHost%%</CESSearchHost>
<CESSearchPort>%%CESSearchPort%%</CESSearchPort>
<CESCertificatePath>%%CESCertificateFile%%</CESCertificatePath>
<!-- Super user token used to provide read access to all indexed documents to the text analytics processes. -->
<SuperUserToken>%%CESSuperUserToken%%</SuperUserToken>
</Configuration>
<!-- Definition of the run -->
<Run Name="MainRun">
...
</Run>
</TextAnalyticsService>
Prochaines étapes?
Vérifiez les plug-ins prédéfinis de mise en marche et de tâche qui sont disponibles (voir Plug-ins de mise en marche d'Analytique de texte et Plug-ins de tâches prédéfinis d'Analytique de texte).