AnsweredAssumed Answered

Contrôle de la tokenisation des propriétés dans lucene

Question asked by jservajean on May 15, 2013
Latest reply on May 25, 2013 by shiv.liferay
Mon content model est réglé par défaut, à savoir que la propriété cm:name est paramétrée de telle sorte que la tokenization est censée s'effectuer et que l'indexation de la propriété dans son ensemble (chaine de caractères) aussi :

<index enabled="true">
   <atomic>true</atomic>
   <stored>false</stored>
   <tokenised>both</tokenised>
</index>


Lors de l'ajout d'un fichier avec un nom contenant des espaces, par exemple "PS-200 Total Acces.doc", le fichier n'est trouvable que sur le premier token "PS-200" et non pas "Acces" ou "Acces.doc" :

@cm\:name:"PS-200" // renvoie tous les fichiers commençant par "PS-200", y compris "PS-200 Total Acces.doc"
@cm\:name:"Acces" // ne renvoie rien
@cm\:name:"Acces.doc" // ne renvoie rien


J'ai l'impression d'être sur un configuration où seul le premier token est indéxé.

Peut-on contrôler le nombre de tokens pris en compte par lucene lors de l'indexation ?

Merci

Outcomes