J'ai quelques questions concernant l'indexation...

cancel
Showing results for 
Search instead for 
Did you mean: 
christophes
Member II

J'ai quelques questions concernant l'indexation...

Bonjour,

J'ai quelques questions concernant l'indexation des fichiers (contenu + métadonnées) dans Lucene. Est-ce que l'indexation se fait à chaque fois qu'on ajoute, modifie ou supprime un fichier ou est-ce qu'elle se lance tous les x temps ? Combien de temps faut-il pour indexer un fichier ? Est-ce que ca dépend de la taille, de l'endroit, … ?

Apparemment certains utilisateurs n'ont parfois pas de résultats lors d'une première recherche et après quelques essais, ils en obtiennent finalement un (alors qu'ils n'ont pas modifié ou ajouter de fichiers pouvant correspondre aux critères de recherche).

Merci d'avance pour vos réponses.

Christophe
3 Replies
egr
Member II

Re: J'ai quelques questions concernant l'indexation...

Bonjour,

L'indexation peut être paramétrée au niveau du modèle (pour une propriété particulière) par les attributs suivants :

<!— Index content in the background –>
        <index enabled="true">
        <atomic>false</atomic>                       <!– Indexing controlled here –>
        <stored>false</stored>
        <tokenised>true</tokenised>
Il semblerait que certains détails du nouveau noeud créé (nouvel ajout de document par exemple) puissent être indexés directement. D'autres détails sont indexés en arrière plan, ils sont placés dans une file d'attente. Le temps d'indexation peut dépendre du nombre d'informations à indexer et du temps de conversion en texte lorsque cela est nécessaire.

Voici un post anglais qui en parle :
http://forums.alfresco.com/viewtopic.php?t=1305&highlight=indexation

Il est donc probable que certains documents ne soient pas de suite accessibles lors d'une recherche. Ce temps de latence est difficilement prévisible. Si quelqu'un possède d'autres informations plus précises, je suis preneur !
christophes
Member II

Re: J'ai quelques questions concernant l'indexation...

Ok merci pour ta réponse.

Je suis aussi preneur d'informations plus précises si quelqu'un en a.

Christophe
michaelh
Active Member

Re: J'ai quelques questions concernant l'indexation...

Les grandes lignes sont expliquées ici : http://wiki.alfresco.com/wiki/Search

Pour le fonctionnement de bas niveau, les ressources sont un peu plus limitées.
En résumé, on peut dire qu'il y a deux indexations, et que de temps de latence est fonction d'un assez grand nombre de paramètres, dont la langue, le type de document, le pourcentage de texte dans le contenu, le nombre d'indexations déjà en cours, la vitesse des disques, …

Dans l'ensemble, à moins de vouloir chercher le document que l'on vient juste d'ajouter (perte de mémoire ?), la latence est assez transparente pour l'utilisateur …