marcarcla

Duda sobre las capacidades de Alfresco

Discussion created by marcarcla on Jan 10, 2018
Latest reply on Jan 14, 2018 by angelborroy

Saludos, es la primera vez que me animo a escribir en este foro aunque ya lo he usado alguna que otra vez. 

 

Según he aprendido en mi corta andadura con alfresco, un gestor documental está pensado precisamente para eso, documentos, que requieran versionado, inclusión en flujos de trabajo, compartición entre distintos usuarios, búsquedas en el texto, etc. Pero no encuentro información acerca de si es válido también para otro tipo de funciones o más bien de las limitaciones y las precauciones a tomar ante ciertos escenarios. 

 

Entrando en detalle, estamos buscando un sistema que sea capaz de gestionar toda la información que se genera en un grupo de laboratorio de investigación biomédica (a nivel interno). Esto incluye desde documentos ofimáticos a ficheros generados con pruebas clínicas, como resonancias magnéticas o encefalografías, ficheros resultantes de secuenciación genética, vídeos de pacientes, etc. No se trata de una gran cantidad de sujetos ya que al tratarse de un grupo de investigación no tenemos las necesidades de un hospital, pero si tenemos unos 6000, de los cuales la mayoría poseen poca información al tratarse de sujetos control (personas sanas para comparar con los que padecen la enfermedad a estudiar), pero al menos 1000 que si tienen una información considerable. También se prevé un crecimiento en el número de sujetos a largo plazo y por supuesto de la cantidad de información registrada de estos nuevos sujetos. Estimamos a medio plazo que dado el gran tamaño de algunos de los ficheros, el tamaño de nuestro repositorio pueda estar en torno a 3-4 TB, posiblemente más, y pensando en el largo plazo esa cifra se superaría con creces.

 

No sabemos si alfresco será capaz de tirar con esa cantidad de datos, si al tener que indexar esa gran cantidad de información se volverá demasiado lento, si después de algún reinicio nos llevará horas o días la regeneración de los índices y todo ello sin contar con una gran máquina para esta tarea (i7 7700K, 32GB de RAM, potente para ser un pc pero no es un servidor). 

 

Se supone que para el almacén de documentos o archivos "finalizados" que no requieran versiones o flujos de trabajo, etc., no se debería usar una herramienta de este tipo, ya que no se le saca partido, pero queríamos usarlo por dos motivos: el primero de ellos, porque queríamos añadir algunos metadatos a esos ficheros para agilizar las búsquedas y en segundo lugar para tener toda la información de archivos/documentos en una misma plataforma, facilitando las tareas de copia y mantenimiento de esa información. 

 

¿Es excesiva la carga de información para una instancia de alfresco?¿Se os ocurre alguna recomendación de arquitectura (varias instancias distintas, repositorios externos,...) que pueda dar soporte a nuestro caso?

 

Muchas gracias de antemano y perdón por la extensión.

Outcomes