Doc produitsMenu

Plateforme Coveo 7.0 >
Aide à l'administrateur > Connecteurs > Connecteur Fichiers > Configuration et indexation d'une source de connecteur Fichiers

Configuration et indexation d'une source de connecteur Fichiers

Une source définit un groupe de paramètres de configuration pour un ou plusieurs partages de fichiers ou sections de partage de fichiers.

Note : Créez au moins deux sources si les partages de fichiers ou les sections de ceux-ci ont besoin d'ensembles différents de paramètres. Une source utilise une ou plusieurs adresses de départ afin de déterminer les emplacements à analyser et à indexer.

Pour configurer et indexer une source de connecteur Fichiers

  1. Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).

  2. Sélectionnez Index > Sources et collections.

  3. Dans la section Collections :

    1. Sélectionnez une collection existante dans laquelle vous souhaitez ajouter la nouvelle source.

      OU

    2. Cliquez sur Ajouter pour créer une nouvelle collection (voir Ajout d'une collection).

  4. Dans la section Sources, cliquez sur Ajouter.

    La page Ajouter une source qui apparaît est organisée en trois sections.

  5. Dans la section Paramètres généraux (General Settings) de la page Ajouter une source (Add Source) :

    1. Tapez la bonne valeur pour les paramètres obligatoires suivants :

      Nom (Name)

      Tapez un nom descriptif de votre choix pour la source du connecteur.

      Exemple : Corporate network file share

      Type de source

      Sélectionnez le connecteur utilisé par cette source. Dans ce cas, sélectionnez Fichiers (Files).

      Adresses

      La liste d'URI d'adresses de départ qui indiquent les emplacements à indexer, une entrée par ligne. Vous pouvez spécifier les URI comme chemins d'accès locaux ou réseau. Les adresses peuvent représenter un dossier ou fichier de système de fichiers, une archive de messagerie, ou même un dossier dans une archive de messagerie.

      Exemples :
      Dossier réseau : file://svr-fileshare/root
      Dossier local : file:///c:/fileshare/root/
      Fichier local : file:///c:/fileshare/root/docs/work.doc
      Archive de messagerie : file://svr-fileshare/mails/jsmith.pst
      Dossier dans une archive de messagerie : file://svr-fileshare/mails/jsmith.pst/work
      Adresse IP file://192.168.1.2/share

      Important : Si vous utilisez des chemins d'accès qui contiennent des lettres de disques comme adresses de départ (ex. : C:\fileshare), les utilisateurs ne pourront pas ouvrir les liens résultants dans la page de résultats de recherche. Une meilleure pratique consiste donc à indexer plutôt les partages de fichiers réseau (ex. : \\Intranet\fileshare).

      Note : Pour Windows Server 2008, un dossier d'accès refusé et les fichiers qu'il contient ne sont pas indexés. Pour Windows Server 2003, si un dossier est défini dans le système de fichiers afin de refuser l'accès au compte d'analyse, le nom du dossier est indexé, mais pas les fichiers qu'il contient.

      Horaire d'actualisation (Refresh Schedule)

      Intervalle de temps pendant laquelle la source est automatiquement actualisée afin de conserver le contenu de l'index à jour. L'option recommandée Every day donne à CES (Coveo Enterprise Search) la consigne d'actualiser la source chaque jour, à minuit.

      Note : Vous pouvez créer de nouveaux horaires d'actualisation de source ou modifier ceux qui existent (voir Création ou modification d'un horaire de source).

    2. Évaluez la valeur des paramètres suivants, qui, la plupart du temps, n'ont pas à être modifiés :

      Appréciation (Rating)

      Changez la valeur seulement si vous souhaitez changer globalement la classification associée à tous les éléments de cette source par rapport à la cote d'autres sources (voir Fonctionnement du classement des résultats de recherche).

      Exemple : Si cette source était pour un ancien système, vous devriez définir ce paramètre à Basse afin que, dans l'interface de recherche, les résultats de cette source apparaissent plus tard dans la liste, contrairement à ceux d'autres sources.

      Types de document (Document Types)

      Si vous avez créé un groupe personnalisé de types de documents pour cette source, sélectionnez-le (voir Création d'un groupe de types de documents). Sinon, sélectionnez Default.

      Langues actives (Active Languages)

      Si vous avez défini des groupes personnalisés de langues actives, veillez à sélectionner celui qui convient le mieux à cette source (voir Ajout et configuration d'un groupe de langues).

      Champs (Fields)

      Si vous avez défini des groupes personnalisés de champs, veillez à sélectionner celui qui convient le mieux à cette source (voir Que sont les groupes de champs?).

  6. Dans la section Paramètres et options spécifiques au connecteur (Specific Connector Parameters & Options) de la page Ajouter une source (Add Source) :

    1. Tapez la bonne valeur pour les paramètres suivants si vous souhaitez indexer le contenu des fichiers d'archive de messagerie.

      Fichier de configuration des archives de courriels (Mapping archives configuration file)

      Si vous décidez d'utiliser un fichier de correspondances d'archive de messagerie, saisissez le chemin d'accès complet qui pointe vers votre fichier de correspondances (voir Indexation des archives de messagerie avec le connecteur Fichiers et Création d'un fichier de correspondances pour l'archive de messagerie).

      Exemple : C:\CES7\Config\Coveo.CES.CustomCrawlers.File.MailArchives.config

      Parcourir les archives de courriels (Expand mail archives)

      Sélectionnez afin d'indexer le contenu des archives de messagerie (.pst). La valeur par défaut est false.

    2. Les valeurs par défaut des paramètres suivants n'ont généralement pas besoin d'être modifiées :

      Nombre de fils d'exécution pendant un Live Monitoring (Number of Live Monitoring Threads)

      Détermine le nombre de changements du système de fichiers que le Live Monitoring du connecteur peut traiter simultanément. La valeur par défaut et recommandée est 1.

      Nombre de tentatives (Max Number of Retries)

      Nombre de tentatives à effectuer si l'indexation d'un fichier qui est ouvert par une autre application échoue. La valeur par défaut et recommandée est 2.

      Nombre de fils d'exécution (Number of Refresh Threads)

      Détermine le nombre de fichiers que le connecteur peut actualiser simultanément. La valeur par défaut et recommandée est 2.

      Parcourir avant de filtrer (Expand before filtering)

      Par défaut, cette option n'est pas sélectionnée, afin que le robot applique des filtres d'inclusion et d'exclusion sur les fichiers, mais également sur les dossiers avant l'analyse, afin qu'il n'agrandisse que des dossiers que vous souhaitez indexer. Dans de rares cas où un filtre d'inclusion ou d'exclusion ne devrait être appliqué qu'à des fichiers (ex. *.tif), vous devez sélectionner cette option afin que le robot parcoure des dossiers afin de voir tous les fichiers et applique les filtres efficacement.

      Note : Sélectionner cette option peut coûter très cher au niveau de la performance. La meilleure pratique consiste à utiliser des filtres d'inclusion ou d'exclusion afin de spécifier des dossiers, pas des types de fichiers. Utilisez plutôt des groupes de types de documents afin de spécifier les types de fichiers à indexer (voir Que sont les groupes de types de documents?).

      Index Share Permissions

      Par défaut, cette option n'est pas sélectionnée. Sélectionnez cette option afin d'indexer le partage et les permissions NTFS (voir le document Microsoft Share and NTFS Permissions on a File Server).

      Paramètres (Parameters)

      Cliquez sur Ajouter un paramètre (Add Parameter), si vous souhaitez afficher des paramètres de source avancés cachés (voir Modification de paramètres de source cachés du connecteur Fichiers).

    3. Les cases à cocher Option n'ont généralement pas besoin d'être modifiés :

      Indexer les sous-dossiers (Index Subfolders)

      Cochez pour indexer tous les sous-dossiers sous les adresses de départ spécifiées.

      Note : Vous pouvez contrôler plus précisément des dossiers ou fichiers spécifiques à analyser à l'aide des filtres d'inclusion ou d'exclusion (voir Ajout ou modification de filtres de source).

      Indexer les métadonnées des documents (Index the document's metadata)

      Lorsque sélectionné, CES indexe toutes les métadonnées du document, mêmes celles qui ne sont pas associées à un champ. Les métadonnées orphelines sont ajoutées au body du document afin qu'elles puissent être recherchées à l'aide de requêtes en texte libre.

      Lorsque non-coché (par défaut), seules les valeurs de champs système et personnalisés dont l'attribut Requêtes textuelles est sélectionné pourront être recherchées sans l'aide d'une requête de champ (voir Ajout d'un champ à utiliser pour la recherche et Que sont les requêtes par champs et les requêtes en texte libre?).

      Exemple : Un document contient deux métadonnées :

      • LastEditedBy, renfermant la valeur Hector Smith

      • Department, renfermant la valeur RH

      Dans CES, le champ personnalisé CorpDepartment est lié à la métadonnée Department, et son attribut Free Text Queries est sélectionné.

      Si l'option Indexer les métadonnées des documents n'est pas cochée, rechercher RH retourne le document, car un champ indexe cette valeur. Rechercher hector ne retourne pas le document, car aucun champ n'indexe cette valeur.

      Si l'option Indexer les métadonnées des documents est sélectionnée, rechercher hector retourne également le document, car CES a indexé les métadonnées orphelines.

      Les adresses de document sont sensibles à la casse (Document's addresses are case-sensitive)

      Laissez la case décochée. Ce paramètre doit être coché seulement, dans de rares situations, pour les systèmes sensibles à la casse dans lesquels des documents distincts peuvent avoir le même nom de fichier, mais une casse différente.

      Générer une version HTML en cache des documents indexés (Generate a cached HTML version of indexed documents)

      Si vous cochez cette case (recommandé), en temps d'indexation, CES crée des versions HTML des documents indexés et les enregistre dans l'index unifié. Dans les interfaces de recherche, les utilisateurs peuvent alors évaluer plus rapidement le contenu en cliquant sur le lien Aperçu rapide pour ouvrir la version HTML de l'élément plutôt qu'en ouvrant le document d’origine avec l'application originale.

      Si la source renferme des fichiers d'archives de messagerie, vous devez sélectionner cette option afin de veiller à ce que les utilisateurs puissent voir le contenu des éléments d'archives de messagerie.

      Vous devriez décocher ces cases seulement si vous ne souhaitez pas utiliser les liens Aperçu rapide ou enregistrer des ressources pendant la génération de la source.

      Ouvrir les résultats avec la version cache (Open results with cached version)

      Laissez cette case décochée (recommandé) afin que, dans les interfaces de recherche, le lien principal de résultats de recherche ouvre le document d'origine avec l'application originale. Vous devriez cocher cette case seulement si vous ne souhaitez pas que les utilisateurs puissent ouvrir le document original, mais qu'ils ne voient que la version HTML du document en tant qu'Aperçu rapide. Si cette option est sélectionnée, vous devez également cocher Générer une version HTML en cache des documents indexés.

      Note : Si vous indexez des fichiers d'archives de messagerie, un groupe personnalisé de types de documents gère la façon dont les éléments d'archive de messagerie sont ouverts à partir des interfaces de recherche (voir Définition d'un type de document pour l'indexation d'archive de messagerie).

  7. Dans la section Sécurité de la page Ajouter une source :

    1. Dans la liste déroulante Fournisseur de sécurité (Security Provider), sélectionnez Active Directory ou un fournisseur de sécurité Active Directory personnalisé que vous avez créé pour un domaine spécifique (voir Configuration d'un fournisseur de sécurité Active Directory).

    2. Dans la liste déroulante Authentification (Authentication), si vous choisissez d'utiliser un compte spécifique afin d'analyser le système de fichiers (voir Mise en place d'un compte d'analyse du système de fichiers), sélectionnez l'identité d'utilisateur que vous avez créée pour ce compte. Laissez ce paramètre vide si vous souhaitez que le connecteur analyse le système de fichiers à l'aide de l'identité du service CES (Coveo Enterprise Search) (voir À propos du compte d'ouverture de session du service CES).

    3. Cliquez sur Enregistrer et activer (Save and Start) pour sauvegarder la configuration de la source et débuter l'indexation de cette source.

  8. Confirmez que le processus de génération de la source est exécuté sans erreur :

    • Dans le panneau de navigation situé à gauche, cliquez sur État, puis confirmez que l'indexation se fait sans erreur.

      OU

    • Ouvrez la console CES afin de surveiller les activités de génération de la source (voir Utilisation de la Console CES.