Bonjour,
Je suis actuellement en train d'effectuer une reprise de donné dans mon entreprise. (Sur Alfresco 3.3g)
J'ai fait plusieurs jeux de tests
Mes temps de traitements explosent en fonction du nombre de documents présent dans Alfresco.
Je m'explique:
pour un nombre de documents présent dans Alfresco faible (moins de 1000 documents) je met en moyenne 0,7 secondes par doc.
pour un nombre plus important de documents présent dans Alfresco (plus de 60 000 documents) je met entre 0,7 et et 6 secondes par docs avec des pointes a 18 secondes
J'utilise le connecteur CMIS pour intégrer les documents ainsi que les métadonnées associés(les "properties" dans alfresco) (une dizaines de métadonnées par documents) je précise que j'ai créé mes propres models.
Si je fait des lots d'import avec redémarrage du serveur entre chaque lots, les temps de traitements sont meilleurs mais ne sont pas aussi bon que lorsqu' Alfresco est vide.
De plus je classe mes fichiers dans des répertoires que je créé automatiquement et je vérifie qu'il n'existent pas déjà, de même pour les fichiers.
J'ai donc plusieurs questions:
Es ce que le connecteur CMIS est limité, ou n'est pas conçus pour attaquer Alfresco lorsqu'il contient beaucoup de documents?
Es ce qu'un folder est limité en nombre de fichier, répertoire?
J'ai de plus une erreur lorsque je parcours un folder trop volumineux –>"A systeme erro happened during the operation: GC overhead limit exceeded"
qu'en pensez vous?
merci d'avance.