Problema con indexación de PDF Texto

cancel
Showing results for 
Search instead for 
Did you mean: 
ricard
Member II

Problema con indexación de PDF Texto

Hola

Estoy teniendo el siguiente problema:

- Genero PDFs mediante JasperReports a partir de contenidos de Alfresco
- Subo estos archivos mediante un webscript

Y al buscar por los contenidos (o el nombre o lo que sea) de estos documentos, no los encuentra.

Como lo subo por webscript es posible que me deje algo por informar (y sea la causa del problema), ¿os ha pasado algo de esto alguna vez? ¿Sabéis cómo arreglarlo?

Gracias y saludos
4 Replies
pjcaracuel_2349
Active Member II

Re: Problema con indexación de PDF Texto

Buenas,

Si no te encuentra documentos ni por contenido ni por nombre del documento o por el valor de algun metadato, entiendo que el problema no esta en la generacion del PDF, sino en la indexacion del documento en el repositorio.

Saludos
ricard
Member II

Re: Problema con indexación de PDF Texto

Me autorespondo jejeje por si a alguien más le pasa.

Resulta que si usamos el webscript que da Alfresco en su wiki para subir un archivo, este se queda guardado con el mimetype "application/octet-stream" y por tanto no indexa su contenido.

Para arreglarlo, he hecho lo siguiente (algo sucio pero funciona):

  upload = espacio.createFile(filename);
  // Me guardo el mimetype que aquí está bien
  oldmimetype = upload.properties.content.mimetype;
  // Este write hace que se pase a octet-stream
  upload.properties.content.write(content);
  // Restauro el content type
  upload.properties.content.mimetype = oldmimetype;

En fin… los webscripts… es lo que tienen Smiley Happy

Y lo del nombre, era porque para buscar parte del nombre hay que hacer la consulta con *texto* en vez de solamente texto como en otros gestores documentales, supongo que debido a la API Lucene.
guillermo_24
Member II

Re: Problema con indexación de PDF Texto

Cuando subo,elimino o modifico algunos archivos… algunas veces la carpeta donde lo ise se pone en blanco me muestra que no hay documentos dentro de la carpeta, tengo ke crear o subir un archivo para que me vuelva a mostrar todos los archivos que tenia …. alguien me peude ayudar???
cristinamr
Advanced

Re: Problema con indexación de PDF Texto

No, dependiento de la versión que uses, creo recordar que era en la 3.3.x cuando subes un documento y te deja la pantalla en blanco te muestra arriba un enlace que pone "Mostrar carpetas" pincha ahí y nos cuenta como fue  :wink:
--
VenziaIT: helping companies since 2005! Our ECM products: AQuA & Seidoc