AnsweredAssumed Answered

[Résolu] Indexation des accents dans contenu HTML

Question asked by sebguillomon on Mar 16, 2009
Latest reply on Sep 3, 2009 by superman
Bonjour,

Décidément, je vais de surprises en surprises avec Alfresco  :x, j'ai créé des contenu HTML dans Alfresco et j'ai testé la recherche via un webservice, mis-à part le fait que la recherche semble instable, je ne comprenais pas pourquoi je ne pouvais pas faire de recherche sur les mot avec des caractères accentués.
J'ai donc ouvert un index avec le jar lukeall (http://www.getopt.org/luke/) et à ma grande surprise, les caractères accentués semble être mal traités par l'analyseur lucene utilisé, par exemple pour rechercher le mot "crédit" (donc "crédit" en html); il faut faire une recherche sur "cr&eacute dit" car le point virgule est supprimé et le reste du mot n'est pas traité. !!!

Quelqu'un a-t-il une solution pour résoudre se problème? Peut-on surcharger le mécanisme d'indexation ?

Merci bcp

Outcomes