Configuration et indexation d'une source Google Sites
Note : Créez des sources Google Sites distinctes lorsque :
-
Vous avez plus d'un compte Google Apps pour gérer vos domaines Google Sites.
-
Une source Google Sites associée à un compte Google privé.
Pour configurer et indexer une source Google Sites
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Sélectionnez Index > Sources et collections.
-
Dans la section Collections :
-
Sélectionnez une collection existante dans laquelle vous souhaitez ajouter la nouvelle source.
OU
-
Cliquez sur Ajouter pour créer une nouvelle collection (voir Ajout d'une collection).
-
-
Dans la section Sources, cliquez sur Ajouter.
La page Ajouter une source qui apparaît est organisée en trois sections.
-
Dans la section Paramètres généraux (General Settings) de la page Ajouter une source (Add Source) :
-
Tapez la bonne valeur pour les paramètres obligatoires suivants :
-
Nom
-
Tapez un nom descriptif de votre choix pour la source du connecteur.
Exemple : Google Sites
-
Type de source
-
Sélectionnez le connecteur utilisé par cette source. Dans ce cas, sélectionnez Google Sites.
Note : Si vous ne voyez pas Google Sites, votre environnement ne rencontre pas les exigences (voir Exigences du connecteur Google Sites).
-
Tapez l'adresse d'un ou plusieurs Google Sites spécifiques dans l'un des formats suivants :
-
Pour un compte privé : https://sites.google.com/site/<my_site>
-
Pour un compte de domaine : https://sites.google.com/a/<my_domain>/<my_site>
OU
Tapez une adresse de départ pour utiliser la détection automatique afin d'analyser tous les sites qui sont accessibles au connecteur à l'aide de l'un des formats suivants :
-
Pour un compte privé : https://sites.google.com/site
-
Pour un compte de domaine : https://sites.google.com/a/<my_domain>
Notes :
-
Les Google Sites retournés par la fonction de détection automatique sont ceux auxquels le connecteur a obtenu l'accès lorsque le ticket d'actualisation OAuth2 a été généré.
-
Seule l'auto-détection de tous les sites accessibles dans un seul domaine est prise en charge, pas pour tous les domaines d'un compte Google Apps spécifique.
-
L'auto-détection ne retourne que des sites avec des permissions de partage permettant explicitement l'utilisateur qui analyse; elle ne retourne pas des sites permettant tout le monde provenant du domaine, ni ne prend en considération les permissions d'administrateur qui autorisent l'accès à tous les sites web du domaine Google App.
-
-
Champs (Fields)
-
Sélectionnez l'ensemble de champs que vous avez créé plus tôt (voir Vue d'ensemble du déploiement du connecteur Google Sites et Que sont les groupes de champs?).
-
Horaire d'actualisation (Refresh Schedule)
-
Intervalle de temps à laquelle l'index est automatiquement actualisé afin de garder le contenu de l'index à jour. Par défaut, l'option Chaque jour (Every day) force CES à actualiser la source chaque jour, à minuit. Étant donné que l'actualisation incrémentale s'occupe de garder la source à jour, vous pouvez sélectionnez une intervalle plus longue, comme Every Sunday (Chaque dimanche) (voir Quelle devrait être la fréquence des horaires d'actualisation de la source?).
-
-
Évaluez la valeur des paramètres suivants, qui, la plupart du temps, n'ont pas à être modifiés :
-
Appréciation (Rating)
-
Changez la valeur seulement si vous souhaitez changer globalement la cote associée à tous les éléments de cette source par rapport à la cote d'autres sources (voir Fonctionnement du classement des résultats de recherche).
Exemple : Lorsqu'une source remplace un ancien système, vous devriez définir ce paramètre à Élevée afin que dans l'interface de recherche, des résultats de cette source apparaissent plus tôt dans la liste, en comparaison avec ceux de sources de l'ancien système.
-
Types de document (Document Types)
-
Si vous avez défini un groupe personnalisé de types de documents pour cette source, sélectionnez-le (voir Que sont les groupes de types de documents?).
-
Langues actives (Active Languages)
-
Si vous avez défini des groupes personnalisés de langues actives, veillez à sélectionner celui qui convient le mieux à cette source (voir Ajout et configuration d'un groupe de langues).
-
-
-
Dans la section Paramètres spécifiques au connecteur (Specific Connector Parameters & Options) de la page Ajouter une source :
-
Dans le champ Mapping File, le chemin d’accès vers le fichier de correspondances par défaut qui définit comment le connecteur gère les métadonnées a rarement besoin d’être changé.
Notes :
-
CES 7.0.7256– (décembre 2014) Tapez le chemin d'accès du fichier de correspondances par défaut qui définit comment le connecteur gère les métadonnées. Vous pouvez laisser cette boîte vide. Dans ce cas, aucune métadonnée de Google Sites ne sera indexée.
Exemple : D:\Program Files\Coveo Enterprise Search 7\Bin\Coveo.CES.CustomCrawlers.GoogleSites.MappingFile.xml
-
CES 7.0.7104– (octobre 2014) Si vous avez créé un fichier de correspondances personnalisé, tapez le chemin d'accès où vous avez enregistré votre fichier dans le serveur Coveo (voir Création d'un fichier de correspondances personnalisé pour le connecteur Google Sites). Vous pouvez laisser cette boîte vide. Dans ce cas, aucune métadonnée de Google Sites ne sera indexée.
Exemple : D:\CES7\Config\MyGoogleSitesMappingFile.xml
-
-
À l'aide des paramètres suivants, autorisez le robot Coveo à accéder à Google Sites :
-
Id du client (Client's id)
-
Tapez l'Id du client que vous avez obtenu précédemment (voir Obtention des valeurs Client ID et Client Secret de Google Sites).
-
Secret du client (Client's secret)
-
Tapez le secret du client que vous avez obtenu précédemment (voir Obtention des valeurs Client ID et Client Secret de Google Sites).
-
Jeton 'refresh' du client (Client's refresh token)
-
Tapez le jeton 'refresh' OAuth2 que vous avez obtenu précédemment (voir Obtention d'un jeton de rafraîchissement OAuth2 de Google Sites).
-
-
Cliquez sur Ajouter un paramètre (Add Parameter) si vous souhaitez afficher et modifier la valeur de paramètres de source avancés (voir Modification de paramètres de source cachés de Google Sites).
-
Les cases à cocher Option n'ont généralement pas besoin d'être modifiés :
-
Indexer les sous-dossiers (Index Subfolders)
-
Ce paramètre n'est pas pris en compte pour ce connecteur.
-
Indexer les métadonnées des documents (Index the document's metadata)
-
Lorsque sélectionné, CES indexe toutes les métadonnées du document, mêmes celles qui ne sont pas associées à un champ. Les métadonnées orphelines sont ajoutées au body du document afin qu'elles puissent être recherchées à l'aide de requêtes en texte libre.
Lorsque non-coché (par défaut), seules les valeurs de champs système et personnalisés dont l'attribut Requêtes textuelles est sélectionné pourront être recherchées sans l'aide d'une requête de champ (voir Ajout d'un champ à utiliser pour la recherche et Que sont les requêtes par champs et les requêtes en texte libre?).
Exemple : Un document contient deux métadonnées :
-
LastEditedBy, renfermant la valeur Hector Smith
-
Department, renfermant la valeur RH
Dans CES, le champ personnalisé CorpDepartment est lié à la métadonnée Department, et son attribut Free Text Queries est sélectionné.
Si l'option Indexer les métadonnées des documents n'est pas cochée, rechercher RH retourne le document, car un champ indexe cette valeur. Rechercher hector ne retourne pas le document, car aucun champ n'indexe cette valeur.
Si l'option Indexer les métadonnées des documents est sélectionnée, rechercher hector retourne également le document, car CES a indexé les métadonnées orphelines.
-
-
Les adresses de document sont sensibles à la casse (Document's addresses are case-sensitive)
-
Laissez la case décochée. Ce paramètre doit être coché seulement, dans de rares situations, pour les systèmes dans lesquels des documents distincts peuvent avoir le même nom, mais une casse différente.
-
Générer une version HTML en cache des documents indexés (Generate a cached HTML version of indexed documents)
-
Si vous cochez cette case (recommandé), en temps d'indexation, CES crée des versions HTML des documents indexés. Dans les interfaces de recherche, les utilisateurs peuvent alors évaluer plus rapidement le contenu en cliquant sur le lien Aperçu rapide plutôt qu'en ouvrant le document d’origine avec l'application originale. Vous devriez décocher ces cases seulement si vous ne souhaitez pas utiliser les liens Aperçu rapide ou si vous souhaitez enregistrer des ressources pendant la génération de la source.
-
Ouvrir les résultats avec la version cache (Open results with cached version)
-
Laissez cette case décochée (recommandé) afin que, dans les interfaces de recherche, le lien principal de résultats de recherche ouvre le document d'origine avec l'application originale. Vous devriez cocher cette case seulement si vous ne souhaitez pas que les utilisateurs puissent ouvrir le document original, mais qu'ils ne voient que la version HTML du document en tant qu'Aperçu rapide. Dans ce cas, vous devez également sélectionner Générer une version HTML en cache des documents indexés.
-
-
-
Dans la section Sécurité (Security) de la page Ajouter une source :
-
Lorsque vous choisissez d'indexer des permissions de Google Sites, dans la liste déroulante Fournisseur de sécurité (Security Provider), sélectionnez le fournisseur de sécurité Google Sites que vous avez créé pour cette source (voir Configuration d'un fournisseur de sécurité Google Sites).
-
Dans la liste déroulante Identité d'utilisateur, sélectionnez l'identité d'utilisateur que vous avez créée pour cette source (voir Vue d'ensemble du déploiement du connecteur Google Sites).
-
-
Cliquez sur Enregistrer (Save) pour enregistrer la configuration de la source.
-
Si vous choisissez de ne pas indexer de permissions Google Sites, vous pouvez définir des permissions au niveau de la source qui s'appliquent à tous les documents dans la source :
-
Dans le panneau de navigation situé à gauche, cliquez sur Permissions.
-
Dans la page Permissions, sélectionnez Précise les permissions de sécurité à indexer.
-
Dans les boîtes Utilisateurs autorisés et Utilisateurs non autorisés, tapez les utilisateurs et les groupes qui ont la permission ou non, respectivement, de voir les résultats de recherche de cette source. Par défaut, tout le monde a la permission (Active Directory Group).
-
Cliquez sur Appliquer les modifications.
-
-
Lorsque vous êtes prêt à débuter l'indexation de la source Google Sites, cliquez sur Régénérer.
-
Confirmez que le processus de génération de la source est exécuté sans erreur :
-
Dans le panneau de navigation situé à gauche, cliquez sur État, puis confirmez que l'indexation se fait sans erreur.
OU
-
Ouvrez la console CES afin de surveiller les activités de génération de la source (voir Utilisation de la Console CES.
-
Prochaines étapes?
Définissez un horaire d'actualisation incrémentale pour votre source (voir Planification d'une actualisation incrémentale de source).
Pensez à modifier certains paramètres de source cachés afin d'essayer de régler d'autres problèmes (voir Modification de paramètres de source cachés de Google Sites).