La recherche lucene par phrase exacte ne fonctionne pas

cancel
Showing results for 
Search instead for 
Did you mean: 
jservajean
Active Member

La recherche lucene par phrase exacte ne fonctionne pas

Mon content modelest configuré par défaut, ainsi le cm:name property devrait être tokenizée et enregistrée en chaine de caractères complète :

<index enabled="true">
   <atomic>true</atomic>
   <stored>false</stored>
   <tokenised>both</tokenised>
</index>


Quand j'ajoute un fichier contenant des esapces, such as "PS-200 Total Acces.pdf", je ne trouve pas les fichiers par recherche lucene en utilisant la phrase "PS-200 Total Acces.pdf" :

@cm\:name:"PS-200 Total Acces.pdf" // ne retourne rien
@cm\:name:"PS-200" // return tous les fichiers contenant ou commençant par "PS-200", dont "PS-200 Total Acces.pdf"


Il semble que mon index soit corrompu ou désynchronisé par rapport à la base de données, mais je ne sais pas comment diagnostiquer ça correctement.
Y a-t-il un moyen de réindéxer un noeud unique (idéalement sans le mettre à jour) ?

Quel logger dois-je configurer dans log4j pour tracer les opérations d'indéxation (atomique ou non) ?

Merci
3 Replies
rguinot
Customer

Re: La recherche lucene par phrase exacte ne fonctionne pas

Quelle est la version utilisée ? Quelle est l'API ou l'interface utilisée pour faire la recherche, et celle qui a été utilisée pour importer le contenu ?

Il y a un outil , appelé Luke, fourni par Lucene, qui vous permet d'explorer les indexes sur disque pour savoir ce qui a été indexé, et comment un texte libre sera indexé par tel ou tel analyzer.
rguinot
Customer

Re: La recherche lucene par phrase exacte ne fonctionne pas

fyi j'ai testé par divers moyens avec le meme nom de fichier également, je ne reproduis pas le pb.
jservajean
Active Member

Re: La recherche lucene par phrase exacte ne fonctionne pas

c'est une 4.0.d
L'API est l'api javascript (dans une définition de workflow), mais j'obtiens les mêmes résultats avec une recherche lucene via le node browser.

J'ai utilisé Luke mais les résultats sont semblables :

@\{http\://www.alfresco.org/model/content/1.0\}name:'ps-200"

renvoie des résultats alors que

@\{http\://www.alfresco.org/model/content/1.0\}name:'ps-200 total acces.pdf"

ne renvoie rien (je passe au passage en minuscules car tous les tokens dans l'index le sont…).

Le fait de simuler comment "un texte libre sera indexé par tel ou tel analyzer" m'intéresse mais je ne sais pas faire dans Luke. Une petite explication m'aiderait !..
Par ailleurs, est-il possible d'utiliser Luke pour reconstruire un index sur un noeud en particulier et si oui comment ?

Merci !