Modification de paramètres de source cachés de Microsoft SharePoint pour l'ancien connecteur
Note : Vous devez régénérer votre source après avoir changé les paramètres avancés.
Pour modifier les paramètres de source avancés de Microsoft SharePoint
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Sélectionnez Index > Sources et collections.
-
Dans la section Collections, sélectionnez la collection renfermant la source SharePoint dont vous souhaitez changer les paramètres avancés.
-
Dans la section Sources, sélectionnez la source SharePoint.
-
Dans le panneau de navigation situé à gauche, sélectionnez Avancé.
-
Dans la page Avancé (Advanced) :
-
Dans la section Balayage (Crawling), sélectionnez les options d'analyse désirées :
-
Indexer les listes cachées et leurs éléments (Index hidden lists and their items)
-
Spécifie si les listes cachées devraient être indexées ou non. SharePoint utilise des listes cachées (ou internes) afin d'enregistrer les informations qui ne sont pas liées au contenu, telles que les galeries de composants WebPart, l'état du flux de travail, etc. Par défaut, ces listes et leurs éléments ne sont pas indexés par défaut.
-
Indexer les éléments redondants des listes de questions ou de problèmes (Index redundant issue list items)
-
Spécifie si les problèmes redondants devraient être indexés ou non. Si un problème est mis à jour dans une liste de problèmes SharePoint, SharePoint crée un nouvel élément de problème et laisse l'ancien élément inchangé. Par défaut, ces vieux problèmes redondants ne sont pas indexés.
-
Indexer les réponses du sondage (Index survey responses)
-
Spécifie si les réponses de sondages devraient être indexées ou non. Si quelqu'un répond à un sondage SharePoint, cette réponse est enregistrée en tant qu'élément de liste dans la liste de sondages. Par défaut, ces réponses ne sont pas indexées.
-
Indexer les documents sauvegardés avec WebDAV (Index documents uploaded with WebDAV)
-
Spécifie si les documents orphelins devraient être indexés ou non. À l'aide de la fonctionnalité WebDAV, il est possible d'enregistrer des documents qui n'appartiennent à aucune bibliothèque de documents SharePoint. Par défaut, ces documents sont indexés.
-
Indexer les balises sociales (Index social tags)
-
Spécifie si les balises sociales devraient être indexées ou non. Dans SharePoint 2010, les utilisateurs peuvent baliser du contenu afin de catégoriser les informations avec des modes d'emploi qui leur sont significatifs. Le balisage social peut améliorer la qualité des résultats de recherche en filtrant contre des balises spécifiques. Par défaut, les balises sociales ne sont pas indexées. Lorsque sélectionné, cette option affecte légèrement les performances d'analyse.
Note : Seules les balises sociales publiques sont indexées, et non les balises sociales personnelles.
-
Désactiver les témoins (Disable cookies)
-
Spécifie si le connecteur devrait mettre en cache et réutiliser les témoins envoyés par le site analysé. Les témoins sont activés par défaut.
-
Développer les sites et les listes avant d'appliquer les filtres (Expand sites and lists before applying filters)
-
Spécifie si le connecteur devrait récupérer les sites Web SharePoint et dresse la liste des enfants avant d'applique les filtres de source. Cette option est nécessaire pour l'indexation d'une partie spécifique d'un site Web ou d'une liste SharePoint. Cette option est désactivée par défaut.
Note : Activer cette option ralentit le connecteur pendant qu'il retrouve tous les enfants de tous les sites Web et les listes de SharePoint et rejette les documents filtrés juste avant de les indexer.
Exemple : Lorsque http://intranet/ est le site web principal, http://intranet/pages/* est le seul filtre d'inclusion de source, et Expand sites and lists before applying filters est sélectionné, les sites web http://intranet/pages/ et http://intranet/pages/news/ sont indexés. Si Développer les sites et les listes avant d'appliquer les filtres n'est pas sélectionné, rien ne sera indexé pendant que http://intranet/ sera filtré.
-
Utiliser l'auteur extrait du document au lieu de l'auteur SharePoint (Use the author extracted from the document instead of the SharePoint author)
-
Un document qui est enregistré dans une bibliothèque de documents SharePoint peut avoir deux auteurs différents, l'auteur du document enregistré dans les propriétés du document et l'auteur enregistré dans la base de données SharePoint, qui représente la personne qui a modifié ou ajouté le document dans SharePoint. Par défaut, CES (Coveo Enterprise Search) utilise l'auteur SharePoint plutôt que l'auteur du document. Sélectionnez cette option afin de modifier ce comportement.
Note : Un effet secondaire de la sélection de cette option est que l'interface de recherche CES SharePoint ne peut lier l'auteur du résultat de recherche à l'utilisateur SharePoint, car l'auteur du document peut ne pas être un utilisateur SharePoint.
-
Activer l'intégration à Microsoft Office (Enable Microsoft Office integration)
-
Spécifie si les documents Microsoft Office devraient être ouverts directement dans SharePoint (à l'aide de SharePoint ActiveX) quand l'utilisateur clique sur un résultat de recherche. Si cette option n'est pas sélectionnée, le document est ouvert à l'extérieur de SharePoint dans l'application Microsoft Office correspondante.
-
-
Dans la section Indexation du contenu des composants WebParts (WebParts Content Indexing), vous pouvez sélectionner l'une de quatre options afin de déterminer comment le connecteur indexe le contenu de Web Parts :
Important : Choisir d'indexer le contenu généré dynamiquement tel que Web Parts peut exposer des informations sécurisées, car le robot peut voir et indexer le contenu auquel tous les utilisateurs n'ont pas accès.
-
Ne pas indexer le contenu des composants WebPart (Don't index the WebParts content)
-
Ignore le contenu des pages Web Part, dont le contenu de Web Parts.
-
Indexer le contenu de tous les composants WebPart (Index the content of all WebParts)
-
Indexe le contenu de l'ensemble de Web Parts dans toutes les pages Web Parts. Cette option n'est pas prise en charge dans SharePoint 2003.
-
Indexer tout le contenu de la page de composants WebPart, incluant les menus (Indexes the full WebPart page content, including menus)
-
Indexe les pages Web Part complètes de la même façon qu'un robot d'indexation le ferait. La page complète étant indexée, dont les menus, les contrôles, etc., cette option peut entraîner de la pollution d'index.
-
Indexer seulement le contenu des composants WebPart de ces types (Index the content of the WebParts of these types only)
-
N'indexe que le contenu de Web Parts dont les types d'assemblage sont présentés dans la boîte de texte qui apparaît si l'option est sélectionnée. Le type Microsoft.SharePoint.WebPartPages.ContentEditorWebPart apparaît par défaut dans la boîte de texte. Cette option est sélectionnée par défaut, mais n'est pas prise en charge dans SharePoint 2003.
Note : Vous pouvez trouver les types d'assemblage des Web Parts que vous souhaitez indexer à partir de Site Settings (voir Découverte du type d'assemblage d'une composante WebPart de SharePoint).
-
-
Dans la boîte Alias du nom du serveur (Server Name Alias), vous pouvez taper un nom de serveur qui, dans l'index, efface celui dont les documents sont téléchargés dans l'index. Ce paramètre est utile afin de faire en sorte que les résultats de requête pointent vers un serveur autre que celui qui est utilisé pour l'indexation.
Exemple : Trois serveurs d'interface SharePoint avec équilibrage de charge réseau gèrent les requêtes des utilisateurs finaux, et votre source analyse un quatrième serveur miroir afin de ne pas affecter la performance pour les utilisateurs. Dans la boîte Alias du nom du serveur, tapez l'URL de l'équilibrage de charge réseau avec laquelle remplacer l'adresse IP dans l'index,
-
Dans la liste déroulante Priorité (Priority), sélectionnez la priorité de téléchargement relative à d'autres sources SharePoint.
-
Dans la section Performance, vous devriez désactiver des fonctionnalités afin d'améliorer la performance :
-
Désactiver l'analyse avancée de la structure des documents PDF (Disable advanced text layout analysis for PDF documents)
-
Pour une meilleure indexation de contenu, CES analyse, par défaut, les documents PDF afin d'identifier les colonnes de texte et restaurer le bon classement de contenu. Ce processus peut être désactivé afin d'enregistrer des ressources d'unité centrale pendant l'indexation.
-
Désactiver le filtrage des doublons (Disable advanced duplicate document filtering)
-
Par défaut, CES applique un filtre avancé afin de n'afficher qu'une copie de chaque document dans les résultats de recherche. Sélectionnez cette option afin de désactiver le filtrage de doublons afin d'enregistrer des ressources d'unité centrale et accélérer l'indexation.
-
-
Dans la boîte Temporisation de la conversion (Conversion Timeout), tapez le nombre de minutes après lesquelles le convertisseur passe à un autre document, même si la conversion n'est pas terminée. Lorsque la temporisation se produit, le document dont la conversion a été abandonnée est considéré comme étant endommagé. Par défaut, la temporisation de la conversion est de 10 minutes.
-
Cliquez sur Appliquer les modifications.
-
-
Commencez l'indexation de la source en cliquant sur Démarrer ou sur Régénérer à partir de la barre de boutons au haut de la page.
-
Confirmez que le processus de génération de la source est exécuté sans erreur :
-
Dans le panneau de navigation situé à gauche, cliquez sur État, puis confirmez que l'indexation se fait sans erreur.
OU
-
Ouvrez la console CES afin de surveiller les activités de génération de la source (voir Utilisation de la Console CES.
-