Doc produitsMenu

Gestion de configurations des pipelines d'Analytique de texte

Une fois que vous avez déployé avec succès votre module Analytique de texte et compris ce qu'est un pipeline, vous pouvez commencer à créer, exécuter et affiner vos propres pipelines d'analytique de texte.

Création d'une mise en marche ou d'une tâche personnalisée à partir d'un modèle

Vous pouvez facilement créer une configuration typique de pipeline avec des valeurs pré-peuplées pour plusieurs paramètres commençant à partir d'un modèle. Les fichiers de modèle de mise en marche ou de tâche contiennent des variables d'espace réservé pour plusieurs valeurs de paramètre qui sont automatiquement remplies avec les bonnes valeurs si vous les utilisez afin de créer une configuration.

Pour créer une mise en marche ou une tâche personnalisée à partir d'un modèle

  1. Démarrez TAnGO (voir Démarrage de TAnGO).

  2. Dans TAnGO, cliquez sur Créer un fichier de configuration (Create Configuration File).

  3. Dans la boîte de dialogue Créer un nouveau fichier de configuration (Create New Configuration File) :

    1. Dans la section Analytique de texte (Text Analytics), sous Chemins d'accès (Paths), dans la boîte Modèle de configuration (Configuration Template), sélectionnez le fichier du modèle de mise en marche ou de tâche sur lequel vous souhaitez baser votre configuration personnalisée.

    2. Cliquez sur Save.

    3. Dans la boîte de dialogue Enregistrer le fichier de configuration sous, naviguez vers le dossier [Text_Analytics_Path]\Config\. Dans la boîte Nom du fichier, tapez un nom de votre choix pour votre pipeline personnalisé (ex.: MyFirstPipeline), puis cliquez sur Enregistrer.

  4. À l'aide d'un éditeur de texte :

    1. Ouvrez le fichier de configuration de pipeline que vous avez tout juste créé.

    2. Tout en respectant le format XML du fichier et des plug-ins disponibles, modifiez ou supprimez les plug-ins existants ou ajoutez de nouveaux plug-ins afin d'obtenir les résultats désirés (voir Plug-ins de mise en marche d'Analytique de texte et Plug-ins de tâches prédéfinis d'Analytique de texte).

    3. Enregistrez le fichier.

Exécuter une mise en marche ou une tâche personnalisée

  1. Démarrez TAnGO (voir Démarrage de TAnGO).

  2. Dans TAnGO :

    1. Cliquez sur Inscrire.

    2. Dans la boîte de dialogue Ouvrir un fichier de configuration, sélectionnez le fichier de configuration de la mise en marche ou de la tâche que vous souhaitez exécuter, puis cliquez sur Ouvrir.

      Le pipeline sélectionné se met en marche une fois ou à des intervalles de temps planifiés.

    3. Dans le panneau Journaux de la tâche (Job Logs), évaluez les journaux d'activité d'analytique de texte afin de vérifier si la mise en marche progresse sans erreurs.

Affinement du rendement d'Analytique de texte

Une fois que vous avez exécuté votre pipeline personnalisé, l'affinement du rendement est souvent un processus itératif impliquant l'ajout et le réglage de plug-ins jusqu'à ce que le rendement désiré soit atteint.

Pour affiner le rendement d'analytique de texte

  1. Inspectez le rendement de votre pipeline d'analytique de texte.

    Exemple : Dans votre interface de recherche, créez des facettes selon les champs créés par votre pipeline d'analytique de texte. Inspectez l'élément de ces facettes (voir Ajout ou personnalisation d'une facette).

  2. Dans une mise en marche, si du contenu inutile ou de trop est traité :

    1. Vous devriez régler le plug-in de récupération afin de mieux cadrer l'ensemble de documents à traiter (voir Récupérateur prédéfini d'Analytique de texte).

    2. Vous devriez utiliser des filtres afin d'exclure une partie du contenu récupéré avant de continuer l'extraction (voir Filtres prédéfinis d'Analytique de texte).

  3. Si vous souhaitez trouver et étiqueter des documents renfermant des chaînes de texte spécifiques, vous devriez créer une liste blanche renfermant ces valeurs et ajouter un plug-in de liste blanche au pipeline (voir Whitelister).

  4. Si des valeurs non désirées apparaissent dans les métadonnées extraites, vous devriez créer un ou plusieurs fichiers de liste noire et ajouter un ou plusieurs plug-ins de liste noire afin d'éliminer les occurrences non désirées (voir MetadataBlackLister).

  5. Si au moins deux valeurs de métadonnées extraites correspondent à un élément unique, vous devriez ajouter un ou plusieurs plug-ins de normalisation afin d’homogénéiser les valeurs de métadonnées (voir MetadataNormalizer).