AnsweredAssumed Answered

Problemas con Lucene (¿bug de Lucene?)

Question asked by ricard on Mar 17, 2009
Hola

Estoy teniendo unos expedientes X con Lucene y el caso es que me pasa tanto en mi máquina de desarrollo (que es una Máquina Virtual hecha con Vmware) como en el servidor de preproducción (que es una máquina física).

Tengo un tipo documental que se llama xx:docXXXXX y un campo que tiene valores a veces acentuados y a veces no.

He desarrollado FTLs para funcionar de modo similar a las vistas que tiene Sharepoint guardándolas en \Diccionario de Datos\Modelo de Contenido y asignándolas a algunos espacios para tal fin.

Hice una primera versión basada en XPath que funciona perfecta, pero es cierto que va bastante lenta (supongo que lo que hace es patearse todo y luego ir eliminando en función del XPath) y estoy intentando pasarlo de companyhome.childrenByXPath[searchString] a companyhome.childrenByLuceneSearch[searchString].

Y me pasa lo siguiente:

Si uso como searchString "+TYPE:\"xx:docXXXXX\" +@xx\\:estadoActual:\"Document*\" saca todo correctamente
Si uso como searchString "+TYPE:\"xx:docXXXXX\" +@xx\\:estadoActual:\"Documentaci*\" solamente salen algunos

Si voy por el node Browser, las propiedades aparecen correctas (con el texto Documentación Clínica, que es uno de los estados, este campo es una combo limitada a ciertos valores). Con Querys de XPath va bien, pero con Querys Lucene no. Había pensado que era un tema de acentos pero en realidad, parece que solo indexa los primeros caracteres o algo parecido… es rarísimo.

He hecho un full rebuild de los índices y todo sigue igual.

¿Alguien ha tenido experiencias de este tipo con Lucene? Por ahora Xpath tiene un rendimiento razonable pero me da miedo cuando superemos los 10mil documentos.

Por si le sirve a alguien, esto me pasa con Alfresco Enterprise 2.2 tanto con SP1 como con el reciente SP3, y ambas máquinas corren sobre Windows 2003 Server al día de parches y MySQL como BBDD.

Agradecería comentarios ;)

Outcomes