Doc produitsMenu

Plateforme Coveo 7.0 >
Aide à l'administrateur > Connecteurs > Ancien connecteur Sitecore > Configuration et indexation d'une source Sitecore pour l'ancien connecteur

Configuration et indexation d'une source Sitecore pour l'ancien connecteur

Une source Sitecore ne cible qu'un site Web Sitecore. Il est recommandé de configurer une source pour chaque site Web Sitecore à indexer.

Pour configurer et indexer une source Sitecore

  1. Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).

  2. Sélectionnez Index > Sources et collections.

  3. Dans la section Collections :

    1. Sélectionnez une collection existante dans laquelle vous souhaitez ajouter une nouvelle source.

      OU

    2. Cliquez sur Ajouter pour créer une nouvelle collection.

  4. Dans la section Sources, cliquez sur Ajouter.

  5. Dans la section Paramètres généraux (General Settings) de la page Ajouter une source (Add Source) :

    1. Tapez la bonne valeur pour les paramètres obligatoires suivants :

      Nom (Name)

      Tapez un nom descriptif de votre choix pour la source du connecteur.

      Exemple : Sitecore Website (English)

      Type de source

      Le connecteur qui est utilisé par cette source. Dans ce cas, sélectionnez Sitecore (Legacy).

      Notes :

      • Sélectionnez Sitecore si vous souhaitez utiliser le nouveau connecteur Sitecore (voir Connecteur Sitecore).

      • Si vous ne voyez pas Salesforce (Legacy) dans la liste Type de source, votre environnement ne rencontre pas les exigences (voir Exigences de l'ancien connecteur Sitecore).

      • Pour CES 7.0.4863 à 5785, l'ancien connecteur Sitecore apparaît dans la liste sous le nom Sitecore tandis que le nouveau connecteur Sitecore (voir Connecteur Sitecore) apparaît sous le nom Sitecore2.

      Adresses

      L'adresse de base de l'installation Sitecore. Tapez une adresse dans la forme suivante :

      http://SitecoreWebsite

      Le connecteur prend en charge http et https.

      Important : Alors que la valeur dans la boîte Adresses pointe vers votre serveur Sitecore, la boîte Site spécifie, par défaut, d'indexer le site Web qui est hébergé dans ce serveur. Dans Sitecore, website est le nom par défaut d'un site. Lorsque le site que vous souhaitez indexer a un nom différent, par exemple lorsque votre serveur héberge plus d'un site, vous devez spécifier le nom du site dans la boîte Target Site.

      Vous pouvez également utiliser la boîte Répertoire de départ du contenu afin de restreindre l'indexation à une ou plusieurs branches de l'arbre de contenu.

      Astuce : Une fois que vous avez indexé votre contenu Sitecore, si vous obtenez des URI cliquables qui renferment http deux fois, comme dans http://http/www.MyServer.com, dans la définition site de votre fichier web.config de Sitecore, veillez à ce que hostName ne renferme pas http://. Si vous souhaitez spécifier explicitement le protocole, utilisez le paramètre scheme (ex.: <site name="WWWPortal" hostName="www.mysite.com" scheme="http" rootPath="/sitecore/content/Home" startItem="/Portal" contentStartItem="/Portal" />).

    2. Évaluez la valeur des paramètres suivants, qui, la plupart du temps, n'ont pas à être modifiés :

      Appréciation (Rating)

      Changez la valeur seulement si vous souhaitez changer globalement la cote associée à tous les éléments de cette source par rapport à la cote d'autres sources (voir Fonctionnement du classement des résultats de recherche).

      Exemple : Si cette source était pour un ancien site Web, vous devriez définir ce paramètre à Basse afin que, dans l'interface de recherche, les résultats de cette source apparaissent plus tard dans la liste, contrairement à ceux d'autres sources.

      Types de document (Document Types)

      Si vous avez défini des groupes personnalisés de types de documents, veillez à sélectionner celui qui convient le mieux à cette source (voir Que sont les groupes de types de documents?).

      Langues actives (Active Languages)

      Si vous avez défini des groupes personnalisés de langues actives, veillez à sélectionner celui qui convient le mieux à cette source (voir Ajout et configuration d'un groupe de langues).

      Champs (Fields)

      Si vous avez défini des groupes personnalisés de champs, veillez à sélectionner celui qui convient le mieux à cette source (voir Que sont les groupes de champs?).

      Horaire d'actualisation (Refresh Schedule)

      Intervalle de temps à laquelle l'index est automatiquement actualisé afin de garder le contenu de l'index à jour. Par défaut, l'option Chaque jour (Every day) force CES à actualiser la source chaque jour, à minuit.

      Note : Vous pouvez créer de nouveaux horaires d'actualisation de source ou modifier ceux qui existent (voir Création ou modification d'un horaire de source).

  6. Dans la section Paramètres spécifiques au connecteur (Specific Connector Parameters & Options) de la page Ajouter une source, vérifiez si vous devez changer les valeurs par défaut des paramètres :

    1. Tapez la bonne valeur pour les paramètres facultatifs suivants :

      Répertoire de départ du contenu (Content Start Path)

      Le point de départ de l'indexation dans l'arbre de contenu de Sitecore. S'il est laissé vide, la valeur par défaut correspond au chemin d'accès racine par défaut du Site. Vous pouvez spécifier un ou plusieurs chemins d'accès de départ en séparant plusieurs nœuds racine avec un point-virgule (;).

      Exemple : /sitecore/content/home/MyNewRootNode;/sitecore/content/Resources

      Astuce : Vous pouvez déterminer le chemin d'accès racine par défaut du fichier web.config de Sitecore, en concaténant les attributs rootPath et startItem d'un site.

      Content Admin

      L'utilisateur Windows qui peut voir tous les documents indexés. Par défaut, il est impossible de voir le contenu indexé d'un document si une source utilise un fournisseur de sécurité afin d'indexer les permissions. Utilisez ce paramètre si la source utilise un fournisseur de sécurité et vous devez voir le contenu indexé du document dans le Navigateur d'index.

      Tapez le nom d'utilisateur dans la forme suivante : DomainName\UserName

      Languages

      Indique les langues indexées. Vous pouvez spécifier les langues à analyser en entrant un ou plusieurs codes de langue, séparés par un point-virgule (;). Tapez le caractère de remplacement * afin d'indexer toutes les langues. Un document est indexé pour chaque langue. Par défaut, si la boîte est vide, un seul document est indexé à l'aide de la langue par défaut du Site cible. Si aucune langue n'est définie dans le site, l'anglais est utilisé.

      Exemple : en;fr-CA

      Note : Les éléments de la bibliothèque média sont toujours indexés avec la langue par défaut du site.

      Fichier de correspondances (Mapping File)

      Tapez le chemin d'accès d'un fichier de correspondances XML valide, qui définit comment le connecteur gère les métadonnées.

      Configurer un fichier de correspondances complet est un élément clé pour tirer profit des métadonnées de Sitecore afin de produire une interface de recherche riche en fonctionnalités (voir Définition d'un fichier de correspondances Sitecore pour l'ancien connecteur).

    2. Si votre site Web Sitecore contient des sections sécurisées, utilisez les paramètres suivants d'authentification par formulaire afin de permettre au connecteur de s'authentifier et d'obtenir l'accès à des pages sécurisées :

      Note : Pendant l'utilisation de l'authentification par formulaire, l'option de source Format du contenu doit être définie à Web Page et Générer une version HTML en cache des documents indexés doit être sélectionné.

      Page de connexion (Login Page)

      URL de la page où les utilisateurs effectuent l'authentification par formulaire.

      Contrôle Nom d'utilisateur (Username Control)

      Identificateur du contrôle où les utilisateurs tapent leur nom d'utilisateur pour l'authentification par formulaire.

      Astuce : Vous pouvez obtenir l'identificateur en inspectant la balise HTML input correspondante de la source de la page Web à l'aide de vos fonctionnalités d'inspection du navigateur.

      Certains sites Web utilisent le contenu dynamique (AJAX). Dans ce cas, la source de page peut ne pas être suffisante pour retrouver l'identificateur de contrôle. Vous pouvez alors utiliser un débogueur Web externe comme Fiddler afin de savoir quelles sont les valeurs qui sont transférées dans le serveur si la commande de connexion est invoquée.

      Exemple : Dans Internet Explorer, sélectionnez Afficher > Source, localisez la balise input correspondante, et faites l'extraction du id (

      ctl00_ctlContentPlaceHolder_ctl00_ctlLogonControl_ctlPanelBar_txtUserName dans l'échantillon de code ci-dessous) 

      <input name="ctl00$ctlContentPlaceHolder$ctl00$ctlLogonControl$ctlPanelBar$txtUserName" type="text" id="ctl00_ctlContentPlaceHolder_ctl00_ctlLogonControl_ctlPanelBar_txtUserName" class="FormInputText" Focus="True" style="width:" />  

      Contrôle Mot de passe (Password Control)

      Identificateur du contrôle où les utilisateurs tapent leur mot de passe pour l'authentification par formulaire.

      Commande de connexion (Login Command)

      Commande de connexion envoyée par la page d'authentification par formulaire.

    3. Révisez la valeur par défaut des paramètres suivants :

      Nombre de fils d'exécution (Number of Refresh Threads)

      Détermine le nombre de téléchargements simultanés que le connecteur prend en charge pour cette source. La valeur par défaut est 2.

      Index si mise en page absente (Index if no Layout)

      Par défaut, les éléments sans mise en page ne peuvent être trouvés directement dans un navigateur Web, et ne sont donc pas indexés. Cochez la case afin d'indexer les éléments qui n'ont pas de mise en page définie. Ceci est utile afin d'indexer le contenu du module d'article de blogue.

      Astuce : Pour les éléments d'articles de blogue, vous pouvez modifier l'URL cliquable à l'aide d'un fichier de correspondances (voir Définition d'un fichier de correspondances Sitecore pour l'ancien connecteur).
      Exemple : Si vous utilisez le module de blogue Sitecore dans l'échantillon de site Printers, le fichier de correspondances suivant peut indexer des articles de blogue si l'option Index si mise en page absente est sélectionnée.
      <?xml version="1.0" encoding="utf-8" ?>
      <Sitecore>
        <CommonMappings>
          <Fields>
            <Title>%[_CESSCDisplayName]</Title>
          </Fields>
        </CommonMappings>
        <Mapping template="{5CF2ED9B-6C32-4FA3-9549-2AB77085B131}"> <!--UserBlog-->
          <Fields>
            <ClickableUri> %[_CESSCServerBaseUrl]/Company/Blogs.aspx?blog=%[Blog Title]</ClickableUri>
            <PrintableUri> %[_CESSCServerBaseUrl]/Company/Blogs.aspx?blog=%[Blog Title]</PrintableUri>
          </Fields>
        </Mapping>
        <Mapping template="{1FBDD65D-5029-46F1-8D75-AF3E68810B25}"> <!--Article-->
          <Fields>
            <ClickableUri>%[_CESSCServerBaseUrl]/Company/Blogs.aspx?post=%[Title]&amp;blog=%[_CESSCParentID.Blog Title]</ClickableUri>
            <PrintableUri>%[_CESSCServerBaseUrl]/Company/Blogs.aspx?post=%[Title]&amp;blog=%[_CESSCParentID.Blog Title]</PrintableUri>
          </Fields>
        </Mapping>
        <Mapping template="{FB71F255-31D5-417A-BD5C-12D458EB8FDB}"> <!--Comment-->
          <Fields>
            <ClickableUri>%[_CESSCServerBaseUrl]/Company/Blogs.aspx?post=%[_CESSCParentID.Title]&amp;blog=%[_CESSCParentID._CESSCParentID.Blog Title]</ClickableUri>
            <PrintableUri>%[_CESSCServerBaseUrl]/Company/Blogs.aspx?post=%[_CESSCParentID.Title]&amp;blog=%[_CESSCParentID._CESSCParentID.Blog Title]</PrintableUri>
          </Fields>
        </Mapping>
      </Sitecore>  

      Inclure la bibliothèque média (Include Media Library)

      Par défaut, cette case est cochée afin d'indexer l'ensemble du contenu de la bibliothèque média. Ceci a le même effet qu'ajouter la bibliothèque média /Sitecore/content/ à la valeur Répertoire de départ du contenu.

      Note : Si des éléments média sont référencés à partir d'éléments de contenu qui sont indexés, ces éléments média sont également indexés, même si cette option n'est pas cochée.

      Base de données (Database)

      Le nom de la base de données Sitecore à indexer. Vous pouvez également taper master afin d'indexer le contenu non-publié du site cible. Si laissé vide, la valeur par défaut correspond à la base de données définie pour le Site.

      Note : Si vous spécifiez une valeur autre que celle par défaut et utilisez un fournisseur de sécurité, vous devez définir le paramètre de base de données du fournisseur de sécurité à la même valeur (voir Configuration d'un fournisseur de sécurité Sitecore pour l'ancien connecteur).

      Public cible (Target Audience)

      Indique au connecteur quelle est l'audience cible de la source. Cette option a un effet sur la façon dont les éléments sont ouverts lorsqu'un utilisateur clique sur un résultat de recherche :

      • Web : Ouvre les résultats en tant que page Web standard. Valeur par défaut.

      • Content Editors : Ouvre les résultats dans l'Éditeur de contenu de Sitecore

      Format du contenu (Body Format)

      Spécifie comment la version HTML en cache d'un document indexé est enregistrée.

      • Web Page : Envoie la version HTML d'un élément tel que rendu par Sitecore. Ceci est la valeur par défaut qui produit un bel Aperçu rapide.

        Il est toutefois important de définir le champ de format dans le fichier d'associations. Sinon, la navigation et d'autres éléments périphériques des pages sont indexés et peuvent être recherchés (voir Définition d'un fichier de correspondances Sitecore pour l'ancien connecteur).

      • Metadata : N'envoie que des métadonnées et des valeurs de Sitecore. L'Aperçu rapide présente une liste non-formatée de toutes les métadonnées et valeurs de Sitecore.

        Cette option est utile pour qu'un administrateur évalue toutes les métadonnées collectées par le connecteur et aide à configurer le fichier de correspondances. Vous pouvez utiliser cette option en collaboration avec l'option Public cible définie à Content Editors.

      Site (Target Site)

      Spécifie le site Sitecore ciblé à indexer. La valeur par défaut est website. Si le site Web Sitecore n'utilise pas le nom par défaut (website), vous devez utiliser ce paramètre et fournir le nom approprié. Vous pouvez obtenir le nom du site à partir du fichier web.config de Sitecore.

      Exemple : L'extrait suivant affiche un fichier web.config de Sitecore, qui définit cinq sites Web. Tous les sites Web qui sont hébergés dans une seule installation de Sitecore sont définis sous le nœud <site> et la chaîne à entrer dans le paramètre TargetSite est celui de l'attribut name.

      <sites>
       ...
       <site name="danish" hostName="da.printers" language="da-DK" virtualFolder="/" 
       <site name="german" hostName="de.printers" language="de-DE" virtualFolder="/" 
       <site name="english" hostName="en.printers" language="en" virtualFolder="/" 
       <site name="british" hostName="gb.printers" language="en-GB" virtualFolder="/" 
       <site name="website" virtualFolder="/" physicalFolder="/" 
        ...
      </sites>
    4. Cliquez sur Ajouter un paramètre (Add Parameter) si vous souhaitez afficher des paramètres de source avancés (voir Modification de paramètres de source cachés de Sitecore pour l'ancien connecteur).

    5. Les cases à cocher Option n'ont, en général, pas besoin d'être modifiées.

      Indexer les sous-dossiers (Index Subfolders)

      Gardez cette case cochée (recommandé). En procédant ainsi, tous les sous-dossiers de l'adresse de départ spécifiée sont indexés.

      Indexer les métadonnées des documents (Index the document's metadata)

      Lorsque sélectionné, CES indexe toutes les métadonnées du document, mêmes celles qui ne sont pas associées à un champ. Les métadonnées orphelines sont ajoutées au body du document afin qu'elles puissent être recherchées à l'aide de requêtes en texte libre.

      Lorsque non-coché (par défaut), seules les valeurs de champs système et personnalisés dont l'attribut Requêtes textuelles est sélectionné pourront être recherchées sans l'aide d'une requête de champ (voir Ajout d'un champ à utiliser pour la recherche et Que sont les requêtes par champs et les requêtes en texte libre?).

      Exemple : Un document contient deux métadonnées :

      • LastEditedBy, renfermant la valeur Hector Smith

      • Department, renfermant la valeur RH

      Dans CES, le champ personnalisé CorpDepartment est lié à la métadonnée Department, et son attribut Free Text Queries est sélectionné.

      Si l'option Indexer les métadonnées des documents n'est pas cochée, rechercher RH retourne le document, car un champ indexe cette valeur. Rechercher hector ne retourne pas le document, car aucun champ n'indexe cette valeur.

      Si l'option Indexer les métadonnées des documents est sélectionnée, rechercher hector retourne également le document, car CES a indexé les métadonnées orphelines.

      Les adresses de document sont sensibles à la casse (Document's addresses are case-sensitive)

      Laissez cette case décochée. Ce paramètre doit être coché seulement, dans de rares situations, pour les systèmes dans lesquels des documents distincts peuvent avoir le même nom, mais une casse différente.

      Générer une version HTML en cache des documents indexés (Generate a cached HTML version of indexed documents)

      Si vous cochez cette case (recommandé), en temps d'indexation, CES crée des versions HTML des documents indexés. Dans les interfaces de recherche, les utilisateurs peuvent alors évaluer plus rapidement le contenu en cliquant sur le lien Aperçu rapide plutôt qu'en ouvrant le document d’origine avec l'application originale. Vous devriez décocher ces cases seulement si vous ne souhaitez pas utiliser les liens Aperçu rapide ou enregistrer des ressources pendant la génération de la source.

      Ouvrir les résultats avec la version cache (Open results with cached version)

      Laissez cette case décochée (recommandé) afin que, dans les interfaces de recherche, le lien principal de résultats de recherche ouvre le document d'origine avec l'application originale. Vous devriez cocher cette case seulement si vous ne souhaitez pas que les utilisateurs puissent ouvrir le document original, mais qu'ils ne voient que la version HTML du document en tant qu'Aperçu rapide. Dans ce cas, vous devez également sélectionner Générer une version HTML en cache des documents indexés.

    6. Dans la liste déroulante Authentification (Authentication), si vous avez créé une identité d'utilisateur Sitecore pour cette source, sélectionnez-la.

  7. Dans la section Sécurité (Security) de la page Ajouter une source :

    1. Dans la liste déroulante Fournisseur de sécurité Active Directory (Active Directory Security Provider), sélectionnez Active Directory ou un fournisseur de sécurité Active Directory personnalisé que vous avez créé pour un domaine spécifique (voir Configuration d'un fournisseur de sécurité Active Directory).

    2. Dans la liste déroulante Fournisseur de sécurité Sitecore (Sitecore Security Provider), sélectionnez le fournisseur de sécurité que vous avez créé pour cette source (voir Configuration d'un fournisseur de sécurité Sitecore pour l'ancien connecteur).

    3. Dans la liste déroulante Authentification (Authentication), sélectionnez l'identité d'utilisateur que vous avez créée pour cette source Sitecore.

  8. Cliquez sur Enregistrer (Save) pour enregistrer la configuration de la source.

  9. Avant d'indexer la source, pensez aux étapes facultatives suivantes :

    1. Vous devriez afficher et modifier des paramètres de source avancés (voir Modification de paramètres de source cachés de Sitecore pour l'ancien connecteur).

    2. Pensez à utiliser un fichier de correspondances personnalisé (voir Définition d'un fichier de correspondances Sitecore pour l'ancien connecteur).

  10. Dans la barre de boutons, cliquez sur Régénérer afin de commencer l'indexation de la source.

  11. Confirmez que le processus de génération de la source est exécuté sans erreur :

    • Dans le panneau de navigation situé à gauche, cliquez sur État, puis confirmez que l'indexation se fait sans erreur.

      OU

    • Ouvrez la console CES afin de surveiller les activités de génération de la source (voir Utilisation de la Console CES.

Prochaines étapes?

Lorsque l'actualisation incrémentale est activée (voir Activation de l'actualisation incrémentale dans une base de données Sitecore pour l'ancien connecteur), définissez un horaire d'actualisation incrémentale pour votre source (voir Planification d'une actualisation incrémentale de source).

Si vous le souhaitez, intégrez l'interface de recherche Coveo dans votre site Web Sitecore (voir Intégration de l'interface de recherche Coveo .NET dans un site Web Sitecore).