Modification de paramètres avancés de la source
Pour modifier les paramètres avancés de la source
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Dans l'Outil d'administration, sélectionnez Index > Sources et collections.
-
Dans la page Sources et collections :
-
Dans la section Collections, sélectionnez la collection qui renferme la source que vous souhaitez modifier.
-
Dans la section Sources, sélectionnez la source que vous souhaitez modifier.
-
Dans le panneau de navigation situé à gauche, sélectionnez Avancé.
-
-
Dans la page Avancé, référez-vous au tableau suivant afin de configurer les paramètres avancés de source disponibles, puis cliquez sur Appliquer les modifications.
Note : Les paramètres disponibles varient selon le type de source.
Section Applicable à Description Balayage
Toutes les sources
Note : Les options d'analyse diffèrent de source en source.
Détermine quels éléments d'une source sont indexés (voir Quelle est la structure de SharePoint?).
Indexer les listes cachées et leurs éléments : Indexe les listes cachées SharePoint. Notez que cette option, qui s'applique aux sources SharePoint Legacy, n'est pas sélectionnée par défaut.
Indexer les éléments redondants des listes de questions ou de problèmes : Indexe des éléments dupliqués SharePoint Issues. Notez que cette option, qui s'applique aux sources SharePoint Legacy, n'est pas sélectionnée par défaut.
Indexer les réponses du sondage : Indexe les réponses à SharePoint Surveys. Notez que cette option, qui s'applique aux sources SharePoint Legacy, n'est pas sélectionnée par défaut.
Indexer les documents sauvegardés avec WebDAV : Indexe les éléments téléchargés dans SharePoint avec WebDAV (c.-à-d. les éléments invisibles dans l'interface). Notez que cette option, qui s'applique aux sources SharePoint Legacy, est sélectionnée par défaut.
Limiter l'analyse à X niveaux : Limite la profondeur de l'analyse. Cette option s’applique à toutes les sources et n’est pas sélectionnée par défaut.
Exemple : Limiter l'analyse à 2 niveaux n'indexe que l'adresse principale (\\CoveoServer\Help\AdminTool\) et les adresses qui y sont directement liées (\\CoveoServer\Help\AdminTool\Sources\), d'autres sous-dossiers ou sous-sites (\\CoveoServer\Help\AdminTool\Sources\Local\) ne sont pas indexés
Permettre l'analyse des liens externes : Indexe les sites Web externes directement liés à un site Web (mais pas leurs sous-pages). Notez que cette option, qui s'applique aux sources sites Web, n'est pas sélectionnée par défaut.
Exemple : Si http://www.coveo.com contient un lien vers http://microsoft.com cette dernière page est indexée; toutefois, http://www.microsoft.com/careers ne l'est pas.
Désactiver les témoins : Rejette les témoins. Cette option est utilisée si les témoins empêchent la Plateforme Coveo d'analyser un site (ex. : ils redirigent le connecteur ailleurs). Notez que cette option, qui s'appliquent aux sources sites Web et SharePoint Legacy, n'est pas sélectionnée par défaut. Développer les sites et les listes avant d'appliquer les filtres : Construit l'arbre de sites et de listes SharePoint avant d'appliquer les filtres. Cette option permet l'indexation d'enfants non exclus à des éléments de parent exclus. Notez que cette option, qui s'applique aux sources SharePoint Legacy, n'est pas sélectionnée par défaut.
Utiliser l'auteur extrait du document au lieu de l'auteur SharePoint : Retire les auteurs de documents SharePoint en utilisant un script de conversion. Si cette option n'est pas sélectionnée, c'est plutôt le nom de l'auteur des métadonnées qui est utilisé. Notez que cette option, qui s'applique aux sources SharePoint Legacy, n'est pas sélectionnée par défaut.
Utiliser des adresses UTF-8 : Indique que les adresses des documents sont en UTF-8 plutôt qu'en format ANSI. Notez que cette option, qui s'applique aux sources Sites Web, n'est pas sélectionnée par défaut (voir Quelle est la différence entre les formats URI ANSI et UTF-8?).
Conserver la dernière date d'accès au fichier : Conserve la dernière date d'accès au fichier—après l'indexation du fichier, la date est celle du dernier accès. Si un utilisateur exécute des sauvegardes, il est important que la date du fichier ne change pas si le fichier n'a pas été accédé.
Prendre en charge l'exclusion des connecteurs : Indique quelles règles d'exclusion des connecteurs (c.-à-d. les commandes interdisant l'analyse d'un site) sont respectées par le connecteur Web. Par défaut, toutes ces règles sont respectées. Il est toutefois possible de ne respecter que les balises Robots.txt ou HTML META. De plus, il est possible d'ignorer toutes les règles d'exclusion. Notez que cette option s'applique aux sources Sites Web.
Téléchargement
Sites Web
Temporisation : Détermine le nombre de secondes après lesquelles le connecteur Web se déconnecte d'une source qui ne répond pas. Notez que la valeur tapée dans ce champ doit être d'au moins 1.
Délai entre les téléchargements : Détermine le nombre de secondes qui s'écoule entre chaque téléchargement effectué par le connecteur Web (prendre une pause entre les téléchargements permet au site de ne pas continuellement gérer des recherches. Un délai de 10 secondes est la norme pour les connecteurs Web sur Internet). Notez que la valeur tapée dans ce champ doit se situer entre 0 et 60.
Alias du nom du serveur
Fichiers locaux/réseau
Sites Web
SharePoint Legacy
Indique le nom du serveur qui est utilisé pour retrouver des documents pendant des requêtes—s'il est différent du serveur qui est analysé durant l'indexation.
Exemple : Il est possible d'indexer des documents sur un ordinateur de mise en lots, mais de les ouvrir sur un ordinateur de production. Dans ce cas, le nom du serveur de production doit être tapé dans le champ Alias du nom du serveur.
Astuce : Le connecteur SharePoint de deuxième génération n’a pas cette option, mais utilise un fichier de correspondances qui vous permet de remplacer les URI Clickable et Printable (voir Création et utilisation d'un fichier de correspondances personnalisé SharePoint). Vous devez créer des métadonnées qui ne contiennent que la partie path (ex. pas de schéma et pas de serveur) de l’URI du document original afin de pouvoir le remplacer par un alias de serveur.
Priorité
Toutes les sources
Détermine l'ordre d'indexation des sources—les sources avec la priorité Maximale sont indexées en premier, tandis que les sources avec la priorité Minimale sont indexées en dernier. Notez que si suffisamment de mémoire et de ressources d'unité centrale sont disponibles, toutes les sources peuvent être indexées en même temps.
Performance
Toutes les sources
Détermine si davantage d'analyse du contenu du document est effectuée durant le processus d'indexation ou non.
Désactiver l'analyse avancée de la structure des documents PDF : Désactive l'analyse avancée de documents PDF afin de conserver des ressources d'unité centrale et d'accélérer l'indexation. Le but de cette analyse avancée est d'améliorer l'appréciation et la rédaction de résumé en déterminant l'ordre de lecture des colonnes dans les documents PDF (l'appréciation et le résumé sont touchés par l'ordre et la proximité des mots). Notez que l'analyse avancée de documents PDF est activée par défaut.
Désactiver le filtrage des doublons : Désactive le filtrage des doublons afin de conserver des ressources d'unité centrale et d'accélérer l'indexation. Le but de ce filtrage avancé est de ne présenter qu'une seule copie de chaque document dans la liste de résultats. Notez que le filtrage de doublons est activé par défaut.
Temporisation de la conversion
Toutes les sources
Détermine le nombre de minutes après lesquelles le convertisseur procède vers un autre document, même si la conversion n'est pas complète (le document dont la conversion n'est pas terminée est considéré comme étant endommagé). Par défaut, le délai de conversion est de 10 minutes.