Modification de la façon dont CES gère un type de document
Pour modifier la façon dont CES gère les fichiers d'un type de document spécifique
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Accédez à la page Groupes de types de documents (Configuration > Types de document).
-
Dans la page Groupes de types de documents, cliquez sur le groupe de types de documents que vous souhaitez modifier.
-
Dans la page Types de documents, cliquez sur le type de documents que vous souhaitez modifier.
-
Dans la page de configuration du type de document sélectionné :
-
Modifiez les paramètres appropriés :
-
Extensions de fichiers (File Extensions)
-
Saisissez une ou plusieurs extensions de fichiers, séparées par des points-virgules, correspondant au type de document.
Exemple : Pour les fichiers d'aide : .chm;.hlp
-
Action
-
Sélectionne l'action d'indexation appropriée qui est prise par CES (Coveo Enterprise Search) pour ce type de document (voir Quelle est la différence entre l'indexation par référence et l'indexation par contenu?):
- Index entire document
-
Indexe l'ensemble du contenu du document. Ceci s'appelle indexation par contenu.
- Index file information only
-
Indexe seulement les métadonnées du fichier. Ceci s'appelle indexation par référence.
- Reject document
-
N'indexe pas le document.
-
Tâches lors d'une erreur d'indexation (Indexing Failure Action)
-
Sélectionnez l'action à prendre si le document est endommagé et ne peut être indexé :
- Index file information only
-
Indexe seulement les métadonnées du fichier.
- Reject document
-
N'indexe pas le document.
-
Convertisseur (Converter)
-
Sélectionnez une des deux options pour spécifier le convertisseur à utiliser pour traiter des documents qui appartiennent au type de document (voir Outil d'administration - Menu Convertisseurs).
- Use a default converter
-
Sélectionnez pour utiliser un des convertisseurs intégrés de CES, puis sélectionnez le convertisseur désiré dans la liste déroulante. Sélectionnez Détecter (Detect) pour laisser CES sélectionner automatiquement le bon convertisseur selon le type de fichier détecté.
- Use an open converter
-
Sélectionnez pour plutôt utiliser un convertisseur ouvert, puis sélectionnez le convertisseur ouvert approprié dans la liste déroulante (voir Custom Converters et Ajout d'un convertisseur ouvert).
-
Types de contenu (Content Types)
-
Si vous le souhaitez, saisissez le type de contenu retourné par des connecteurs personnalisés pour ce type de document.
Exemple : binarydata.
-
Valeur de champ sysfiletype (sysfiletype Field Value)
-
Sélectionnez la valeur du champ sysfiletype (voir Outil d'administration - Menu Champs).
- Use the value set by the converter
-
Par défaut, sélectionnez cette option pour laisser le convertisseur sélectionné définir la valeur de champ.
- Use this value
-
Sélectionnez pour définir une valeur personnalisée, indépendante du convertisseur, puis saisissez la valeur souhaitée dans la boîte.
-
Sélectionnez le mode de génération de la version HTML en cache d'un document indexé de ce type (voir À propos de l'Aperçu rapide amélioré):
Note : L'option Aperçu rapide est disponible à partir de CES 7.0.6547 (mars 2014).
-
Par défaut (Default)
Sélectionnez pour créer la version HTML en cache avec la fonctionnalité d'Aperçu rapide original.
L'Aperçu rapide original est une version HTML simple qui a peu d'impact sur la taille de l'index et l'indexation, mais permet toujours aux utilisateurs finaux de localiser rapidement des termes recherchés dans le document. Lorsque le document contient des images ou est riche en contenus graphiques, l'Aperçu rapide original peut ne pas être une version visuellement représentative du document original.
Il est conseillé de sélectionner Default pour les types de documents qui ne contiennent que du texte, ou seulement des contenus graphiques qui ne sont pas obligatoires pour évaluer la définition du document.
-
LibreOffice et PDF2HTMLEx
Sélectionnez pour créer des Aperçus rapides améliorés pour ce type de document à l'aide de LibreOffice afin de convertir des documents en format PDF, et PDF2HTMLEx pour convertir le PDF en format HTML. Cette option produit la reproduction HTML la plus précise des documents originaux, mais exige beaucoup de ressources du serveur et augmente de façon marquée la taille de l'index.
Il est conseillé de sélectionner LibreOffice et PDF2HTMLEx seulement pour les types de documents avec des contenus graphiques importants et significatifs tels que les documents Microsoft PowerPoint.
-
LibreOffice seulement
Sélectionnez pour créer des Aperçus rapides améliorés pour ce type de document, mais en utilisant seulement LibreOffice pour convertir des documents directement en format HTML. Cette option produit une reproduction HTML moins précise des documents originaux, mais requiert également moins de ressources et n'augmente pas autant la taille de l'index.
Il est également conseillé de sélectionner LibreOffice seulement uniquement pour des types de documents avec des contenus graphiques importants et significatifs. Sélectionnez LibreOffice seulement plutôt que LibreOffice et PDF2HTMLEx lorsque vous pouvez compromettre dans la qualité de reproduction d'HTML pour réduire les exigences dans les ressources du serveur.
Note : L'option LibreOffice seulement est disponible avec CES 7.0.6607+ (avril 2014).
Notes : Lorsque LibreOffice et PDF2HTMLEx ou LibreOffice seulement est sélectionné :
-
Si la conversion d'un document donné échoue, l'Aperçu rapide original est créé en tant qu'option de secours et sera disponible pour les résultats de recherche correspondants dans l'interface de recherche.
-
Si un document PDF est indexé, PDF2HTMLEx est utilisé pour générer le HTML.
-
-
Option
-
-
Lors de l'indexation de pièces jointes, indexez le document parent (When indexing attachments, index the parent document)
-
Cochez cette case afin d'indexer les pièces jointes ou les documents d'archives (ex. : documents dans les fichier .zip) avec leur document parent. Par défaut, cette option n'est pas sélectionnée.
-
Hériter des options de la source (Inherits source options)
-
Cochez cette case pour appliquer les options Désactiver les résumés intelligents et Ouvrir les résultats avec la version cache sélectionnées pour la source parent au type de document (voir Modification de paramètres généraux de la source). Cette option est sélectionnée par défaut. Décochez cette case afin de personnaliser les deux options suivantes.
-
Désactiver les résumés intelligents et l'extraction de concepts (Disable intelligent document summarization and concept extraction)
-
Cochez cette case afin d'applique une option Désactiver les résumés intelligents différente au type de document de celui qui est sélectionné pour la source parente. Pour que cette option soit disponible, décochez Hériter des options de la source. L'option Désactiver les résumés intelligents n'est pas sélectionnée par défaut (voir Qu'est-ce qu'un résumé?).
-
Ouvrir les résultats avec la version cache (Open results with cached version)
-
Cochez cette case afin de forcer des éléments de résultats de recherche de ce type de document à ouvrir dans un Aperçu rapide avec une version cache, indépendamment de l'option Ouvrir les résultats avec la version cache définie pour la source parente. Pour que cette option soit disponible, décochez Hériter des options de la source. L'option Ouvrir les résultats avec la version cache n'est, par défaut, pas sélectionnée.
-
-
Séquence de sélection de titre (Title Selection Sequence)
-
Utilisez les flèches afin de définir l'ordre des actions prises afin de tenter de définir le titre du document indépendamment de la source parente. Si CES ne peut extraire un titre avec la première option, il procède à la deuxième, et ainsi de suite. Le titre apparaît dans la liste de résultats de recherche. Pour que cette option soit disponible, décochez Hériter des options de la source (Inherits source options).
-
Métadonnée pour le titre (Title Metadata Name)
-
Utilise une Métadonnée pour le titre pour indexer le type de document qui est différent de celle sélectionnée pour la source parente. Pour que cette option soit disponible, décochez Hériter des options de la source (Inherits source options).
-
-
Cliquez sur Appliquer les modifications.
-
Prochaines étapes?
Veillez à ce que ce groupe de types de documents modifié soit associé à la (aux) bonne(s) source(s) (voir Modification du groupe de types de documents utilisé par une source).