Hola!
Se me plantea una duda acerca de los ficheros en alfresco, a ver si alguien puede solventarla.
Tengo una serie de ficheros subidos al alfresco, entiendo que al subirlos se suben tanto físicamente como en la base de datos para poder realizar búsquedas de contenido dentro del documento, ¿me equivoco? esta es la manera por defecto que tiene alfresco de subir los ficheros, no sé si estoy en lo correcto pero me imagino esto ya que ocupa bastante espacio en la máquina.
Mi pregunta es si hay alguna manera, parámetro etc. que le señalice al alfresco que este fichero que estoy subiendo no quiero que indexe el contenido, si no solo los metadatos/propiedades para que no ocupe tanto, ya que hay ficheros que con las propiedades me basta
Espero haberme explicado bien
Saludos y gracias.
Buenas.
Por partes:
Tengo una serie de ficheros subidos al alfresco, entiendo que al subirlos se suben tanto físicamente como en la base de datos para poder realizar búsquedas de contenido dentro del documento, ¿me equivoco? esta es la manera por defecto que tiene alfresco de subir los ficheros, no sé si estoy en lo correcto pero me imagino esto ya que ocupa bastante espacio en la máquina.
Umagina que tienes un usuario en tu Alfresco llamado Domingo con el que subes un documento, text.docx. En ese momento tiene asociado unas propiedades tales como nombre, titulo, descripción, etc... A nivel de interfaz eso es lo que ocurre, pero a nivel de servidor tenemos dos partes:
¿Qué papel juega Solr? Solr no es más que un puntero que sabe dónde está localizado ese binario y sus propipedades. Cada vez que un usuario clicka en un documento, solr actúa y rescata desde tu repositorio y tu base de datos toda la información.
Así es a groso modo como funciona :-) Evidentemente hay un proceso más complejo por detrás, pero con que te quedes con esta idea, podrás ir leyendo más información acerca de esto.
Mi pregunta es si hay alguna manera, parámetro etc. que le señalice al alfresco que este fichero que estoy subiendo no quiero que indexe el contenido, si no solo los metadatos/propiedades para que no ocupe tanto, ya que hay ficheros que con las propiedades me basta
Alfresco te da la capacidad de definir tu propio modelo de datos reutilizando las propiedades que ya exiasten. Cuando realizas tu modelo de datos con tus propiedades personalizadas (por ejemplo VAT tipo numérico, o Carnet de conducir de tipo texto) ahí, a ese nivel, es dónde tu defines qué quieres que se indexe y qué no.
Por defecto Alfresco indexa todo. Si quieres deshabilitar alguna propiedad te recomendaría que realizaras tu propio modelo de datos con propiedades y juegues con ellas.
Te dejo enlaces que creo que pueden servirte de ayuda para los dos temas (solr y modelo de datos):
Alfresco y SOLR, presentación en español
Solr overview | Alfresco Documentation
Repository concepts | Alfresco Documentation
Content Model | Alfresco Documentation
Working With Custom Content Types in Alfresco | ECMArchitect | Alfresco Developer Tutorials
Espero que te haya aclarado un poco ambos temas y al menos tengas información desde la que puedes comenzar a investigar.
Un saludo,
Cristina.
Muchas gracias Cristina, muy útil tu respuesta!
Saludos
Es posible controlar la indexación del contenido por archivo.
Para eso es necesario añadir un aspecto llamado cm:indexControl al archivo, y entonces, configurar la propiedad cm:isContentIndexed como false.
Más informaciones en https://docs.alfresco.com/5.1/concepts/admin-indexes.html
Además del "aspecto" comentado por Douglas C. R. Paes es posible controlar la indexación desde tu modelo de contenido e incluso desde SOLR.
- How to avoid indexing full content in Alfresco - zylk
Saludos.
--C.
Discussions about Alfresco Content Services and Alfresco Process Services in Spanish
Related:
By using this site, you are agreeing to allow us to collect and use cookies as outlined in Alfresco’s Cookie Statement and Terms of Use (and you have a legitimate interest in Alfresco and our products, authorizing us to contact you in such methods). If you are not ok with these terms, please do not use this website.