Modifier ou utiliser les paramètres avancés de l'index
Pour modifier ou utiliser les paramètres avancés de l'index
-
Dans le serveur Coveo, accédez à l'Outil d'administration (voir Ouverture de l'Outil d'administration).
-
Sélectionnez Index > Avancé.
-
Dans la page Avancé (Advanced), modifiez ou utilisez les paramètres avancés de l'index qui sont présentés dans la capture d'écran et le tableau qui suivent, puis cliquez sur Appliquer les modifications (Apply Changes).
Section Description Détermine le nombre de résultats qui seront sujets à un deuxième classement, qui sera plus précis—ce deuxième classement assure que seuls les documents les plus pertinents sont présentés au-dessus de la liste de résultats. Les valeurs entre 2 et 1000 sont acceptées. La valeur par défaut est de 100.
Note : Ce procédé demande beaucoup de ressources de l'unité centrale. Augmenter la valeur de ce champ au-dessus de 100 documents peut ralentir le processus de recherche. Pour accélérer CES, il est possible de limiter le processus de classement supplémentaire à 20-50 documents. Ceci est habituellement suffisant, l'utilisateur moyen affichant rarement plus de deux pages de résultats.
Les paramètres Compléter la transaction après n Secondes (Commit transaction after n minutes), Minutes ou Heures) spécifient l'intervalle de temps à laquelle une transaction est complétée, même si elle n'a pas atteint sa limite de taille maximale (voir Qu'est-ce qu'une transaction?).
La valeur par défaut est 1 minute. Elle est appropriée pour les opérations d'indexation normales où des sources existantes sont continuellement actualisées, ce qui permet à de nouveaux documents d'être traités rapidement, et ainsi ne pas limiter la fraîcheur de l'index.
Lorsque le délai de recherche est un problème et l'indexation presque en temps réel est activée, vous pouvez définir une valeur de sous-minute en secondes (voir À propos de l'indexation presque en temps réel).
Le désavantage principal de tels intervalles courts est que les robots sont brièvement interrompus à chaque complètement de transaction. Vous devriez augmenter la valeur seulement pendant que vous générez ou régénérez initialement de très grosses sources.
Exemple : Pendant que vous régénérez une source Exchange de 50 millions de documents, il est conseillé de définir une limite de temps plus haute pour le complètement de transaction (ex. : 30 minutes) afin que chaque transaction puisse écrire de façon plus efficace de grosses quantités de données dans l'index.
Notes :
-
Si une transaction n'est pas écrite dans l'index, son contenu ne peut être recherché.
-
L'option de définir les paramètres Compléter la transaction après n en Secondes, et ainsi pour moins d'une minute est disponible à partir de CES 7.0.6942 (août 2014).
Détermine si une majorité (2/3) de la taille de la mémoire cache doit être assignée à la recherche ou l'indexation. Il est également possible de permettre des ressources équivalentes (1/2 de la taille de la mémoire cache) pour chaque procédé. Dans ce cas, il est conseillé d'augmenter la mémoire cache disponible afin que chaque processus ait accès à suffisamment de mémoire.
Exemple : Si 50 Mo de mémoire cache est disponible, et que Optimiser pour l'indexation (Optimize for indexing) est sélectionné, alors 33 Mo sont disponibles pour l'indexation (2/3 de la mémoire cache) et 17 Mo pour la recherche (1/3 de la mémoire cache). Si Optimiser pour la recherche et l'indexation (Optimize for indexing and querying) est sélectionné, 25 Mo sont consacrés à chaque processus (1/2 de la mémoire cache).
La valeur dans la boîte Taille de la mémoire cache (Memory cache size) détermine la limite maximale de taille de la mémoire pour forcer le complètement de transactions.
Note : Augmenter la mémoire cache disponible pour l'indexation et la recherche ralentit les autres processus de système (ex. : l'index).
Fournit des noms équivalents pour les champs (si CES est incapable de trouver un nom de champ dans la base de données CES7, il recherche des ensembles d'alias). L'ensemble Default Aliases contient des noms alternatifs pour les champs intégrés (voir Alias de champs disponibles).
Exemple : author est un alias pour sysauthor, car les utilisateurs ont tendance à oublier sys avant les noms de champ (c.-à-d. une requête pour @author retourne les mêmes résultats qu'une requête pour @sysauthor).
Vous pouvez ajouter de nouveaux alias de champ ou créer des ensembles différents d'alias de champ dans la page Groupes d'alias de champ (Configuration > Alias de champ) (voir Gestion d'alias de champs).
Notes :
-
Un seul ensemble d'alias de champ à la fois peut être utilisé sur l'index.
-
Pour les versions de CES antérieures à 7.0.6607 (avril 2014), vous devez redémarrer le service CES afin qu’une modification au groupe d’alias de champs soit effective.
Champs à valeurs multiples (Multiple Value Fields) Un champ à valeurs multiples est un champ pouvant contenir deux ou plusieurs valeurs que l'on considère comme étant indépendantes. Si un champ à valeurs multiples est utilisé afin de créer une facette dans l'interface de recherche, ses valeurs sont présentées séparément dans la facette.
Le champ Séparateurs de valeurs (Value Separators) vous permet de changer ou d'ajouter des caractères étant reconnus comme étant des séparateurs de valeurs de champ indépendantes.
Le caractère par défaut (;) doit être utilisé pour tous les champs intégrés. D'autres référentiels, comme des bases de données ou des applications internes, peuvent utiliser des séparateurs différents.
Important : Changer ou ajouter des caractères de Séparateurs de valeurs peut briser les séparateurs existants de valeurs de champ. Contactez Coveo Support pour obtenir de l'aide avant d'essayer de changer ce paramètre.
Permet l'usage de caractères de remplacement dans les requêtes (voir Préfixes et opérateurs de recherche).
Dans Nombre de caractères requis en préfixe (Number of Leading Chars), tapez le nombre minimal de caractères requis que l'utilisateur doit taper avant un caractère de remplacement. La valeur par défaut est de 2. Il est déconseillé d'utiliser une valeur inférieure à deux, car ceci donnerait des requêtes complexes au niveau du calcul.
Dans Nombre de candidats (Number of candidates), spécifiez le nombre de termes pouvant potentiellement remplacer une expression de remplacement. Augmenter la valeur peut avoir un effet sur la performance. La valeur par défaut est 32. Vous pouvez augmenter, de façon sécuritaire, cette valeur à 128.
Note : Les requêtes de caractères de remplacement sur l'ensemble du contenu d'un index prendront toujours plus de temps pour retourner des résultats. Pour le contenu où les caractères de remplacement sont appropriés, vous devriez penser à isoler les données dans un champ, et utiliser le champ pour la recherche de caractères de remplacement (voir Que sont les requêtes par champs et les requêtes en texte libre?).
Spécifie la quantité de mémoire à consacrer à la mise en cache de facettes.
Expansion par radicaux
Le calcul des classes de lemmatisation pour les mots recherchés est automatiquement effectué pendant les heures creuses afin de réduire le temps d'indexation (voir À propos de l'indexation par radicaux). Vous pouvez toutefois amorcer ce calcul pour tous les termes indexés en tout temps, en cliquant sur Démarrer l'analyse avancée des classes de lemmatisation (Perform advanced analysis on language stemming classes).
Exemple : Après la réindexation de grosses sources, vous ne devriez pas attendre jusqu'à la prochaine période creuse avant de mettre à jour les classes de lemmatisation.
Important : Forcer le calcul de tous les termes indexés en cliquant sur Démarrer l'analyse avancée des classes de lemmatisation peut nécessiter un grand nombre de ressources d'ordinateur.
Correcteur syntaxique (Word Corrector Lexicon)
L’index maintient un lexique de correction de mots qui trie les termes indexés par leur nombre d’occurrences et est utilisé par l’algorithme de suggestion d’épellation de la fonctionnalité de correction de requête pour trouver des variantes d’épellation plus fréquentes et proposer une correction (voir Fonction de correction de requête et Comment sont gérés les mots mal orthographiés?).
Le calcul du correcteur syntaxique est effectué pendant les heures creuses afin de réduire le temps d'indexation. Vous pouvez toutefois initier ce procédé en tout temps en cliquant sur Régénérer le correcteur syntaxique (Rebuild Word Corrector Lexicon).
-