Configuration et indexation d'une source RSS
Pour configurer et indexer une source avec le connecteur RSS
-
Veillez à ce que votre environnement réponde aux exigences de la source RSS :
-
Coveo Enterprise Search (CES) 7.0.6942+ (août 2014).
-
Connecteur RSS inclus dans votre licence Coveo (voir Quelles informations sont affichées dans la page Licence?).
-
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Sélectionnez Index > Sources et collections.
-
Dans la section Collections :
-
Sélectionnez une collection existante dans laquelle vous souhaitez ajouter la nouvelle source.
OU
-
Cliquez sur Ajouter pour créer une nouvelle collection (voir Ajout d'une collection).
-
-
Dans la section Sources, cliquez sur Ajouter.
-
Dans la section Paramètres généraux (General Settings) de la page Ajouter une source (Add Source) :
-
Tapez la bonne valeur pour les paramètres obligatoires suivants :
-
Nom (Name)
-
Tapez un nom descriptif de votre choix pour la source du connecteur.
Exemple : CNN Technology RSS Feed
-
Type de source
-
Le connecteur qui est utilisé par cette source. Dans ce cas, sélectionnez RSS.
-
Adresses
-
Saisissez l'URL du fil RSS à indexer en copiant et collant le lien correspondant du fil RSS sous la forme file:/// ou http://.
Exemples : Pour indexer le fil Stack Overflow, l'URL est :
http://stackoverflow.com/feeds
Vous pouvez saisir plus d'une adresse de fil RSS dans des lignes distinctes, mais vous devez vérifier si tous les paramètres de source s'appliquent à tous les fils RSS. Sinon, créez d'autres sources pour d'autres fils.
-
Horaire d'actualisation (Refresh Schedule)
-
À moins que vos fils RSS prennent en charge OpenSearch (voir Extension OpenSearch), sélectionnez (aucun) lorsque vous souhaitez conserver, dans votre source, de vieux éléments RSS précédemment indexés qui ne sont plus disponibles à partir du fil RSS. Une actualisation complète, comme une régénération, supprime de la source les vieux éléments qui ne sont plus disponibles à partir du fil.
Sélectionnez un intervalle tel que every day lorsque vous ne souhaitez que faire les derniers fils recherchables.
Notes : Configurez un horaire d'actualisation incrémentale dans votre source pour la maintenir à jour (voir Planification d'une actualisation incrémentale de source.
-
-
Évaluez la valeur des paramètres suivants, qui, la plupart du temps, n'ont pas à être modifiés :
-
Appréciation (Rating)
-
Changez la valeur seulement si vous souhaitez changer globalement la cote associée à tous les éléments de cette source par rapport à la cote d'autres sources (voir Fonctionnement du classement des résultats de recherche).
Exemple : Si cette source était pour un fil RSS important, vous devriez définir ce paramètre à Élevée afin que, dans l'interface de recherche, les résultats de cette source apparaissent plus tôt dans la liste de résultats de recherche, contrairement à ceux d'autres sources.
-
Types de document (Document Types)
-
Si vous avez défini des groupes personnalisés de types de documents, veillez à sélectionner celui qui convient le mieux à cette source (voir Que sont les groupes de types de documents?).
-
Langues actives (Active Languages)
-
Si vous avez défini des groupes de langues personnalisés, veillez à sélectionner celui qui convient le mieux à cette source (voir Ajout et configuration d'un groupe de langues).
-
Si vous avez créé un groupe de champs RSS personnalisé pour cette source, sélectionnez-le. Sinon, laissez le Default Scheme (voir Que sont les groupes de champs?).
-
-
-
Dans la section Paramètres et options spécifiques au connecteur (Specific Connector Parameters & Options) de la page Ajouter une source (Add Source) :
-
Vérifiez si vous devez changer les valeurs par défaut des paramètres suivants :
-
Nombre de fils d'exécution (Number of Refresh Threads)
-
Détermine le nombre de téléchargements simultanés que le connecteur prend en charge pour cette source. La valeur par défaut est 2.
-
Le chemin d'accès vers le fichier de correspondances. Laissez la valeur par défaut pour utiliser le fichier de correspondances par défaut qui vient avec le connecteur (Coveo.CES.CustomCrawlers.RSSCrawler.MappingFile.xml). Si vous créez un fichier de correspondances personnalisé, saisissez le chemin d'accès complet vers votre fichier de correspondances personnalisé. Contactez Assistance Coveo pour obtenir de l'aide si vous avez besoin de personnaliser le fichier de correspondances.
-
-
Dans la section Option, évaluez la valeur par défaut des options à cocher suivantes :
-
Indexer les sous-dossiers (Index Subfolders)
-
Cochez afin d'indexer tous les sous-dossiers situés sous l'adresse spécifiée de serveur RSS. Sélectionné par défaut.
-
Indexer les métadonnées des documents (Index the document's metadata)
-
Lorsque sélectionné, CES indexe toutes les métadonnées du document, mêmes celles qui ne sont pas associées à un champ. Les métadonnées orphelines sont ajoutées au body du document afin qu'elles puissent être recherchées à l'aide de requêtes en texte libre.
Lorsque non-coché (par défaut), seules les valeurs de champs système et personnalisés dont l'attribut Requêtes textuelles est sélectionné pourront être recherchées sans l'aide d'une requête de champ (voir Ajout d'un champ à utiliser pour la recherche et Que sont les requêtes par champs et les requêtes en texte libre?).
Exemple : Un document contient deux métadonnées :
-
LastEditedBy, renfermant la valeur Hector Smith
-
Department, renfermant la valeur RH
Dans CES, le champ personnalisé CorpDepartment est lié à la métadonnée Department, et son attribut Free Text Queries est sélectionné.
Si l'option Indexer les métadonnées des documents n'est pas cochée, rechercher RH retourne le document, car un champ indexe cette valeur. Rechercher hector ne retourne pas le document, car aucun champ n'indexe cette valeur.
Si l'option Indexer les métadonnées des documents est sélectionnée, rechercher hector retourne également le document, car CES a indexé les métadonnées orphelines.
-
-
Générer une version HTML en cache des documents indexés (Generate a cached HTML version of indexed documents)
-
Si vous cochez cette case (recommandé), en temps d'indexation, CES crée des versions HTML des documents indexés. Dans les interfaces de recherche, les utilisateurs peuvent alors évaluer plus rapidement le contenu en cliquant sur le lien Aperçu rapide plutôt qu'en ouvrant le document d’origine avec l'application originale. Vous devriez décocher ces cases seulement si vous ne souhaitez pas utiliser les liens Aperçu rapide ou si vous souhaitez enregistrer des ressources pendant la génération de la source.
-
Ouvrir les résultats avec la version cache (Open results with cached version)
-
Laissez cette case décochée (recommandé) afin que, dans les interfaces de recherche, le lien principal de résultats de recherche ouvre le document d'origine avec l'application originale. Vous devriez cocher cette case seulement si vous ne souhaitez pas que les utilisateurs puissent ouvrir le document original, mais qu'ils ne voient que la version HTML du document en tant qu'Aperçu rapide. Dans ce cas, vous devez également sélectionner Générer une version HTML en cache des documents indexés.
-
-
Cliquez sur Enregistrer (Save) pour enregistrer la configuration de la source.
-
-
Étant donné que les fils RSS ne sont pas sécurisés, le connecteur RSS n'indexe pas de permissions et vous devez modifier l'option Permissions par défaut pour définir les permissions globalement dans la source :
Note : Vous obtenez le message d'erreur suivant dans la Console CES lorsque l'option Indexer les permissions de sécurité est sélectionnée par défaut.
L'indexation de permissions n'est pas fournie par le robot RSS. Vous devez configurer manuellement les permissions de la source '[Source_Name]'.
-
Dans le panneau de navigation à gauche, sélectionnez Permissions.
-
Dans la page Permissions :
-
Sélectionnez l'option Précise les permissions de sécurité à indexer.
-
Facultativement, dans la liste Utilisateurs autorisés, ajoutez ou retirez des utilisateurs ou des groupes afin de spécifier précisément qui a accès au contenu de cette source.
Par défaut, le groupe everyone d'Active Directory spécifie que tout utilisateur d'Active Directory peut voir l'ensemble du contenu de cette source.
-
Facultativement, dans la liste Utilisateurs refusés, ajoutez ou retirez des utilisateurs ou des groupes afin de spécifier qui n'a pas accès au contenu de cette source.
-
Cliquez sur Appliquer les modifications.
-
-
-
Dans la barre d'outils, cliquez sur Start/Rebuild pour débuter l'indexation de votre source.
-
Confirmez que le processus de génération de la source est exécuté sans erreur :
-
Dans le panneau de navigation situé à gauche, cliquez sur État, puis confirmez que l'indexation se fait sans erreur.
OU
-
Ouvrez la console CES afin de surveiller les activités de génération de la source (voir Utilisation de la Console CES.
-
Prochaines étapes?
Définissez un horaire d'actualisation incrémentale pour votre source afin de la maintenir à jour avec le fil RSS Planification d'une actualisation incrémentale de sourceScheduling a Source Incremental Refresh).