AnsweredAssumed Answered

Indicizzazione documenti in Alfresco e ricerca contenuti

Question asked by vincenzo.esposito on Jan 31, 2019

Salve,

ho effettuato l'installazione di Alfresco Community 6.0 su una macchina Virtuale Debian con assegnati 20GB di RAM e 8 Core, utilizzando la procedura di installazione mediante Docker-Compose, per poi configurare le variabili di environment in modo da avviare i container come di seguito riportato:

 

  • # Alfresco JVM Memory Settings
    ALFRESCO_XMX=2g
    ALFRESCO_XMS=1g
  • # Share JVM Memory Settings
    SHARE_XMX=2g
    SHARE_XMS=1g
  • # Solr 6 JVM Memory Settings
    SOLR_XMX=10g
    SOLR_XMS=10g

 

Ho anche provveduto a modificare i parametri di solrconf.xml e solrcore.properties come suggerito su varie guide (e.g. Solr Tuning – Maximizing your Solr Performance | vienergie ) per migliorare l'indicizzazione dei documenti caricati.

Una volta effettuate le dovute configurazioni, ho effettuato l'upload di un migliaio di documenti attraverso un'applicazioncina sviluppata in JAVA utilizzando le librerie OpenCMS: i documenti sono correttamente caricati al path indicato e posso accedervi al contenuto cliccandoci e facendo una ricerca nel testo.

Dopo la fase di Upload, mi sono sincerato dello stato di indicizzazione mediante il SUMMARY di SOLR (../solr/admin/cores?action=SUMMARY&wt=xml), nel quale riscontro che per il core Alfresco lo stato di indicizzazione è il seguente:

 

<str name="Approx change set indexing time remaining">0 Seconds</str>

<str name="Approx content indexing time remaining">0 Seconds</str>

 

Supponendo quindi che la fase di indicizzazione sia "terminata", ho provato ad effettuare una ricerca mediante la barra di Alfresco Share in base al contenuto, inserendo nel campo di ricerca una parola da cercare, ad esempio la congiunzione "che" , la quale è presente in più di un documento: la ricerca non ha prodotto pero' risultati... Ho anche provato a ricercare parole più grandi contenute nei documenti caricati, ma il risultato è sempre lo stesso..

Dai log non denoto nessuna anomalia, ne in fase di caricamento, ne succesivamente, quindi posso pensare che ci sia qualcosa che non va su Solr6, oppure quando viene effettuato l'upload, il contenuto non viene caricato correttamente, cosa che però mi sembra strana dato che da Share accedo ai file posso fare ricerche nel loro contenuto..

Seguendo la guida (https://community.alfresco.com/docs/DOC-4673-search#Finding_nodes_by_content ) ho provato anche a ricercare i documenti che avessero errori nel contenuto (TEXT:'nint' OR TEXT:'nitf' OR TEXT:'nicm') , ma il risultato è stato sempre nullo, quindi suppongo che il contenuto dei documenti sia stato individuato, ma forse l'indicizzazione non è andata a buon fine.. Sarebbe possibile vedere su un documento che indici ci sono?

Se qualcuno sapesse come aiutarmi ne sarei grato.

 

Grazie,

Vincenzo

Outcomes