Au sujet de l'index
Faits relatifs à l'index :
-
L'index est organisé en source et en collections (voir La hiérarchie des composantes Coveo expliquée).
-
L'index enregistre les occurrences et les positions de toutes les variations de termes, dont celles renfermant des caractères accentués et tous les petits noms communs.
-
L'index enregistre la présence, dans les documents, de termes avec des variations de capitalisation (premières, toutes ou certaines lettres en majuscules) ou du formatage spécial (gras, italique, souligné,...), mais n'enregistre pas leurs positions.
-
L'index détecte et sauvegarde le codage et la langue de chaque document indexé pour un grand nombre de langues (voir Langues prises en charge).
-
En temps de requête, l'index étend les termes recherchés en utilisant des algorithmes de lemmatisation uniques aux langues afin de retourner un ensemble plus complet de résultats (voir À propos de l'indexation par radicaux). Vous pouvez choisir dans quelle langue l'expansion sera effectuée (voir Configuration de la culture d'un hub de recherche).
-
L'index maintient un lexique de correction de mots qui trie les termes indexés selon leur nombre d'occurrences et qui est utilisé par l'algorithme de suggestion d'épellation de la requête afin de trouver des variations plus fréquentes d'épellation et de proposer une correction (voir Comment sont gérés les mots mal orthographiés?).
-
L'index minimise les erreurs possibles de lemmatisation en calculant un facteur de corrélation entre le terme recherché et toute expansion possible. Dans les résultats de recherche, les documents contenant des expansions hautement corrélées sont placés plus haut que ceux présentant de pauvres expansions corrélées.
Exemple : Si vous recherchez univers, en raison du fonctionnement de l'algorithme de lemmatisation, l'index étendra votre requête en utilisant des termes des classes de souche univer pouvant inclure université. Si les termes univers et université coexistent rarement dans vos documents indexés, les documents renfermant université se retrouvent plus bas.
Note : Les calculs de corrélation sont effectués durant la période creuse pour les termes recherchés. Vous pouvez toutefois lancer ce calcul à partir de l'Outil d'administration (voir Modifier ou utiliser les paramètres avancés de l'index).
-
L'index peut traiter des caractères de remplacement dans des recherches de phrase (voir Utilisation des opérateurs de recherche dans les requêtes) et lors de l'utilisation de l'opérateur PRÈS DE (voir Préfixes et opérateurs de recherche). Vous pouvez activer/désactiver la possibilité d'utiliser des caractères de remplacement dans des requêtes (voir Modifier ou utiliser les paramètres avancés de l'index).
-
L'index retire continuellement et automatiquement toute référence à des documents supprimés (voir À propos du processus d'auto-optimisation de l'index).