[Résolu] Problème sur recherche simple

cancel
Showing results for 
Search instead for 
Did you mean: 
georgess_3386
Member II

[Résolu] Problème sur recherche simple

Sous Company Home>sites j'ai créé deux espaces : Compta et Fournisseurs et sous chacun d'eux j'ai créé, j'ai créé 3 espaces : Attente, Réglé, Archivé

J'ai loadé sous Compta>Attente une facture  appelée facture_erronee.doc
Le title est Georges
La description est Sté DUBOIS
L'author est Georges STROUMPF - BlueStar

J'ai loadé sous Fournisseur>Attente une facture  appelée facture_C1234567.doc
Le title est Facture
La description est DURAND
L'author est Georges STROUMPF - BlueStar

1) Lorsque je fait une recherche avec ALL ITEMS ou FILENAME ONLY avec le critère de recherche *doc : j'ai mes deux factures qui sont trouvées

2) Lorsque je fait une recherche avec ALL ITEMS ou FILENAME ONLY avec le critère de recherche facture ou facture*: seule facture_erronee.doc est trouvée (???)

3) Lorsque je fait une recherche avec ALL ITEMS ou FILENAME ONLY avec le critère de recherche facture_erronee.doc ou facture_erronee: aucune facture trouvée (???)

4) Lorsque je fait une recherche avec ALL ITEMS ou FILENAME ONLY avec le critère de recherche facture_C1234567.doc : la facure est trouvée ce qui est bien, mais pourquoi ne pas avoir trouvé la facture dans la précédente recherche ?

5) Lorsque je fait une recherche avec ALL ITEMS ou FILENAME ONLY avec le critère de recherche facture_C1234567 : la facure n'est plus trouvée 
   par contre si je fais une recherc avec facture_C1234567* la facture est de nouveau trouvée

Bref, tout cela est plus qu'étrange. Quelqu'un a t il quelque chose là dessus ?

Merci par avance
16 Replies
georgess_3386
Member II

Re: [Résolu] Problème sur recherche simple

Désolé j'ai omis de mettre la version je suis en Alfresco 3.2 en WIN7
rguinot
Customer

Re: [Résolu] Problème sur recherche simple

Avez vous installé le pack de langues francophone ?
Avez vous lu la documentation de base : http://wiki.alfresco.com/wiki/Search ? en particulier la section Understanding_tokenization

Comprenez bien que ce qui est étrange pour vous, est le comportement attendu par d'autres. il est difficile de contenter tout le monde.
Sachez aussi que si le comportement de base ne vous convient pas, il est possible de le modifier par de nombreuses manières :

- en changeant les analyzers lucene par défaut
- en configurant explorer ou share
- en écrivant son composant d'interface exploitant des recherches multi-critères personnalisées
- ….

Egalement, il faut savoir que le comportement en recherche simple et recherche avancée et différent (par défaut), i.e différente tokenisation des champs saisis
georgess_3386
Member II

Re: [Résolu] Problème sur recherche simple

Merci pour ces informations qui reste pour moi plus que nébuleuses d'autant qu'il semble ne pas y avoir de documentation sur le sujet "recherche" qui puisse m'éclairer, en dehors du lien proposé où j'en suis sorti plus déprimé qu'en y entrant….

1) Vous me demandez si j'ai installé le pack français… Je n'en sais rien : j'ai installé ALFRESCO en français, maintenant est ce la réponse que vous attendiez ?
    Sinon que faut il faire pour installer ce pack ?
2) vous écrivez : "Comprenez bien que ce qui est étrange pour vous, est le comportement attendu par d'autres. il est difficile de contenter tout le monde". Certes, mais je ne suis qu'un petit débutant en informatique, qui n'a que 40 ans de carrière derrière lui et j'ai du mal à m'expliquer qu'une recherche toute simple, avec un seul critère ne puisse aboutir dans la même configuration au même résultat. Moi cela me choque, mais je suis certainement trop puriste.

Je réitère le contexte :
a) J'ai mis deux documents dans le même  workspace. Leurs noms est respectivement facture_C1234567.doc et facture_erronee.doc, vous pouvez voir que ces deux noms de documents ont une structure identique et ne comportent pas d'accent (sujet 1).
b) je fais une recherche simple en cochant FILENAME ONLY et en mettant comme critère facture* : il ne m'est retourné que le document facture_C1234567.doc  et …   :lol: ce n'est pas le même que la dernière fois !.
Si ceci n'est pas étrange pour vous, moi, je reste convancu qu'il devrait m'être retournés 2 documents.
Je reste néanmoins à l'écoute d'une contradiction à mes espérances et convictions, du moins sur ce point
rguinot
Customer

Re: [Résolu] Problème sur recherche simple

1) http://forge.alfresco.com/projects/languagefr/
2) je ne reproduis pas le problème.
georgess_3386
Member II

Re: [Résolu] Problème sur recherche simple

J'avais vu dans une de vos réponses sur un cas similaire (…) que vous préconisiez de mettre dans Alfresco.global.properties la définition suivante :
log4j.logger.org.alfresco.web.bean.search.SearchContext=debug sensée donner la trace de la requête de recherche. J'ai fait, arrêter et relancer Alfresco mais je ne vois rien ni dans alfresco.log ni dans catalina.log (vous m'aviez parlé d'un catalina.out dans un précédent problème, j'ai fait une recherche totale sur mon disque, je n'ai pas trouvé ce fichier.

Pourriez vous SVP me dire si il y à autre chose à faire pour activer cette trace, ainsi que le nom du fichier recevant ces traces et son path ?

Pour information en faisant une recherche simple sur le FILNAME ONLY et comme critère soit facture* ou soit *facture* il retourne un seul document.
Si maintenant en gardant FILNAME ONLY et comme critère soit factur* ou soit *factur* c'est à dire que j'enlève le E, il retourne deux documents, ce qui est le résultat attendu  Smiley Very Happy .
Désolé, mais je continue de penser personnellement que c'est étrange.

J'avais vu aussi dans le cas similaire cité plus haut que vous suggériez d'utiliser une recherche simple pour faire une requête sur le champ TITLE en
faisant la modification suivante dans le fichier web-client-config-custom.xml :
<config>
      <client>
         <simple-search-additional-attributes>
            <qname>{http://www.alfresco.org/model/content/1.0}description</qname>
            <qname>{http://www.alfresco.org/model/content/1.0}title</qname>
         </simple-search-additional-attributes>
      </client>
   </config>

J'ai fait aussi, arrêté et relancé Alfresco, je pensais trouver le champ TITLE du menu déroulant de requête simple, comme ALL ITEMS ou FILENAME ONLY, mais je n'ai rien vu de changer.
Pourriez vous me dire ce qu'il fallait attendre de cette modification et ce que je n'ai pas fait pour que cela ne fonctionne pas ?
rguinot
Customer

Re: [Résolu] Problème sur recherche simple

la définition de debug n'est pas a mettre dans alfresco-global.properties, mais dans log4j.properties.
la config que vous citez pour le web client permet de rechercher également sur le titre et la description, irrelevant dans votre cas.

encore une fois, les résultats de recherche dépendent de la locale. je vous suggère de relire la page Search, et l'outil Luke (http://www.getopt.org/luke/) pour comprendre comment un stream est tokenizé, stemmé, et filtré pour tel ou tel analyzer (l'utilisation de ceux ci dépendent de la locale).
jayjayecl
Active Member II

Re: [Résolu] Problème sur recherche simple

En l'occurence, si vous êtes plutôt pressé d'arriver à des résultats de recherche plus convaincants, je vous suggère de réindexer tout votre contenu en changeant d'analyzer Lucene.
En l'occurence, selon quelques tests rapides que j'ai effectués :

1/ L’analyzer  dit « FrenchSnowball » (Réindexation1) est intéressant :
- il est insensible à la casse
- il est indépendant du nombre du mot cherché (singulier / pluriel renvoient les même résultats)
- La lemmatisation permet une recherche étendue. Par exemple, si on recherche le mot « évaluation », on aura parmi les résultats des documents contenant les termes « evalu » ou « evalua » (reconnaissance de la racine du mot)
- la recherche étoilée fonctionne correctement
- la recherche est sensible aux accents : « enquete » et « enquête » ne renvoient pas les même résultats

2/ L’analyzer  dit « AlfrescoStandard » (Réindexation2) est celui utilisé par défaut pour les contenus anglais dans Alfresco :
- il est insensible à la casse
- il est dépendant du nombre du mot cherché (singulier / pluriel renvoient des résultats différents)
- Aucune lemmatisation propre à la langue n’est faite
- la recherche étoilée fonctionne correctement
- la recherche est insensible aux accents : « enquete » et « enquête » renvoient les même résultats

Enfin, après avoir choisi l'analyzer qui vous sied, voici la procédure :

A/ Arrêter Alfresco
B/ Dans tomcat/webapps/alfresco/WEB-INF/classes/alfresco/model, modifier le contenu du fichier dataTypeAnalysers_fr.properties :

Pour la configuration « AlfrescoStandard » :

# Data Type Index Analyzers

#d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.fr.FrenchAnalyzer
#d_dictionary.datatype.d_content.analyzer=org.apache.lucene.analysis.fr.FrenchAnalyzer

#d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.FrenchSnowballAnalyser
#d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.FrenchSnowballAnalyser

d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser
d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser
Pour la configuration « FrenchSnowBall » :

# Data Type Index Analyzers

#d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.fr.FrenchAnalyzer
#d_dictionary.datatype.d_content.analyzer=org.apache.lucene.analysis.fr.FrenchAnalyzer

d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.FrenchSnowballAnalyser
d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.FrenchSnowballAnalyser

#d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser
#d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser

C/ Lancer la procédure de réindexation

Bonne chance
georgess_3386
Member II

Re: [Résolu] Problème sur recherche simple

Merci pour votre réponse claire.

Pourriez vous SVP me dire si il existe une documentation exhaustive où je pourrai trouver l'ensemble des informations sur le produit afin de ne pas solliciter constamment le forum ? Cela coule peut être de source pour certains qui baignent dedans depuis X temps, mais moi qui utilise Alfresco pour la première fois, je suis perdu.

Je vous pose donc deux questions auxquelles j'espère vous aurez la gentillesse de répondre :

En ce qui concerne le logj4.properties pour tracer les requêtes, il en existe 4 dans différents répertoires, c'est très simple à gérer ! J'ai fait les modifs
dans Alfresco\Tomcat\webapps\alfresco\WEB-INF\classes, mais est ce le bon ? Je pourrai effectivement, les tester les uns après les autres, c'est sur, mais je n'ai pas le temps.

J'ai regardé sur le forum pour faire une réindexation, j'ai vu qu'il fallait dans un premier temps mettre le parametre index.recovery.mode=FULL, mais pourriez vous SVP me dire dans quel fichier et à quel endroit ?

Merci par avance pour votre aide
pitititi
Member II

Re: [Résolu] Problème sur recherche simple

pour la doc il y en a sur le site d'alfresco (wiki, blog, …) ou sur le net, ou encore sur le site "Content Community"
[[http://community.alfresco.com/]]

pour la question d'index c'est ici [dossier d'install d'Alfresco]/tomcat/shared/classes/alfresco-global.properties