Doc produitsMenu

Récupérateur prédéfini d'Analytique de texte

Une seule étape de récupération doit apparaître au début d'un pipeline d'analytique de texte. Le récupérateur doit récupérer le groupe de documents sur lequel le pipeline fonctionnera.

Présentement, seul un plug-in de récupération prédéfini est disponible.

CESIQuerierFetcher

Le récupérateur CESIQuerierFetcher récupère des documents de l'index unifié Coveo afin d'assembler le groupe de documents que le pipeline d'analytique de texte va traiter. Utilisez les paramètres suivants afin de configurer le récupérateur.

<AddTitle>
<AddBody>

Par défaut, le titre et le corps de chaque document sont ajoutés au contenu qui sera traité. Vous pouvez définir ces paramètres facultatifs à False pour empêcher ces inclusions.

Note : AddBody fonctionne seulement lorsqu’un Aperçu rapide est disponible pour les documents indexés. Vous devez sélectionner l’option de source Générer une version HTML en cache des documents indexés pour créer des Aperçus rapides de documents (voir Modification de paramètres généraux de la source) .

<AddField>

Vous pouvez, si vous le désirez, définir une ou plusieurs instances de ce paramètre afin d'ajouter le contenu de champs textuels (type chaîne seulement) personnalisés et de système.

<Query>

Ce paramètre établit la portée de la récupération des documents en spécifiant une requête valide.

Exemples :

  • @syscollection=Intranet
    Ne récupère que des documents de la collection Intranet.

  • @syssource="CRM"
    Ne récupère que des documents de la source CRM.

  • @syslanguage=English
    Ne récupère que des documents en Anglais.

<SaveState>

Ce paramètre doit être défini à True pour des mises en marche constantes. La valeur de champ @sysrowid du dernier document traité est sauvegardée dans un fichier cookie spécifié dans le paramètre global de configuration <StateFolder> (voir Paramètres globaux de configuration d'Analytique de texte).

<SaveStateFrequency>

Ce paramètre spécifie le nombre de documents à traiter entre chaque sauvegarde de la valeur de champ @sysrowid dans le fichier qui est spécifié dans le paramètre global de configuration <StateFolder>. Par défaut, l'état est enregistré à chaque 30 documents afin d'empêcher la surécriture du fichier.

Exemple :

<Fetcher>
  <Impl>Coveo.TextAnalytics.Implementations.CESIQuerierFetcher, Coveo.TextAnalytics.Implementations</Impl>
  <Configuration>
    <!-- Scope which documents to retrieve -->
    <Query>@uri</Query>
    <SaveState>True</SaveState>
    <SaveStateFrequency>30</SaveStateFrequency>
    <AddTitle>True</AddTitle>
    <AddBody>True</AddBody>
    <AddField>@myfield</AddField>
    <AddField>@anotherfield</AddField>
    <!-- A valid CES certificate is needed to search and retrieve documents -->
    <CertificatePath>C:\ces7\Config\Certificates\cert-iis.p12</CertificatePath>
  </Configuration>
</Fetcher>