Bulk-Import von sehr vielen Dokumenten - Fragen

cancel
Showing results for 
Search instead for 
Did you mean: 
dsc
Member II

Bulk-Import von sehr vielen Dokumenten - Fragen

Hallo zusammen,

über die API klappt bei uns das hinzufügen von Dokumenten in einen definierten Space sehr gut. Soweit keine Probleme.
Entsprechend große BIN-Dateien finden sich nach dem Import dann logischerweise auch im Dateisystem.

Als Alfresco-Neuling hätte ich dazu ein paar Fragen:

1. Warum werden die BIN-Files auf dem Dateisystem nicht gelöscht, wenn ich im Space alle Dateien lösche? Zu Test- und Entwicklungszwecken habe ich natürlich häufig die selben Dateien immer wieder reingespielt und wieder gelöscht. Kann ich dieses Verhalten des Nicht-Löschens irgendwie verändern? Greift hier evtl. das Versioning?

2. Kann man Alfresco in irgendeiner Form Clustern um eine höhere Verfügbarkeit und Performance zu erreichen? Der Hintergrund ist der, dass eine sechsstellige Anzahl an Word- und PDF-Datein über die API hochgeladen werden sollen und das ganze wenn möglich keine Woche dauern soll. Zudem wäre interessant, wie bei einem Clustering die im Dateisystem gespeicherten Dokumente mit anderen Alfresco-Instanzen synchronisiert werden.

Bin für jeden Tip und Hinweis sehr dankbar!

Schöne Grüße,
Dominik
3 Replies
bwerner
Member II

Re: Bulk-Import von sehr vielen Dokumenten - Fragen

Hi Dominik,

Wann die Files physikalisch gelöscht werden kann man konfigurieren.
Per default werden die Files noch 14 Tage behalten und Du kannst dieses über die Trashcan Funktion in dieser Zeit wieder herstellen. Wie die Konfiguration genau aussieht findest Du hier:
http://wiki.alfresco.com/wiki/Content_Store_Configuration#Deleting_Files

Du kannst Alfresco natürlich auch im Cluster betreiben. Welche Form von Clustering Du betreiben möchtest hängt auch von der Umgebung ab. Hier findest Du auf jeden Fall die Konfiguration:
http://wiki.alfresco.com/wiki/Cluster_Configuration_V2.1.3_and_Later

Beste Grüße,
Bernhard
itnovum
Member II

Re: Bulk-Import von sehr vielen Dokumenten - Fragen

Hallo Dominik,

zu Punkt 1 noch eine Ergänzung:

Ab Version 3.3 lässt sich das Löschverhalten von Alfresco über die alfresco-global.properties regeln.
Dazu einfach folgende Einträge aus der repository.properties ergänzen.


# Decide if content should be removed from the system immediately after being orphaned.
# Do not change this unless you have examined the impact it has on your backup procedures.
system.content.eagerOrphanCleanup=false
# The number of days to keep orphaned content in the content stores.
#    This has no effect on the 'deleted' content stores, which are not automatically emptied.
system.content.orphanProtectDays=14
# The CRON expression to trigger the deletion of resources associated with orphaned content.
system.content.orphanCleanup.cronExpression=0 0 4 * * ?

VG
dsc
Member II

Re: Bulk-Import von sehr vielen Dokumenten - Fragen

Dank Euch für die informativen und schnellen Antworten!
Als Alfresco Einsteiger tut man sich halt manchmal schwer, die Infos zu finden, die man benötigt.

Schöne Grüße,
Dominik