V2.0 Indizierung von Dokumenten / dt. Übersetzung

cancel
Showing results for 
Search instead for 
Did you mean: 
dmc
Active Member

V2.0 Indizierung von Dokumenten / dt. Übersetzung

Seit ein paar Tagen beschäftige ich mich mit Alfresco und finde gefallen an dieser Lösung, obgleich ich bis vor kurzem selber nie mit Tomcat geabeitet habe, weshalb der Einstieg, respektive die Installation, nicht ganz einfach war.

Nun läuft Alfresco also in einer Etch-VM in Verbindung mit MySQL. Es gibt bislang allerdings zwei Punkte, die ich nicht klären konnte.

1a. Beim Einstellen eines PDF beispielsweise sorgt in der Standard-Installation ein Programm (Lucene?) dafür, dass der Inhalt für spätere Recherchen indiziert wird. Das funktioniert insofern auch bei mir, als dass PDF-Dateien, die Text enthalten auch über die Suche gefunden werden können. Leider trifft das aber nicht auf alle PDF-Dokumente zu. Allen ist gemein, dass Sie keine Bilder, sondern einfachen Text enhalten; meiner Auffassung nach gibt es lediglich im Hinblick auf die Dateigröße Unterschiede. Dateien mit einer Größe von 4 MB machen kein Problem; Dateien, die 8 MB groß sind, wurden offensichtlich nicht indiziert, da der Inhalt des Dokuments nicht über die Suche recherchiert werden kann.

Wie kann ich der Sache auf den Grund gehen?

1b. Wie kann ich den Index neu erstellen lassen? In einem Beitrag, der schon etliche Monate alt ist, las ich, dass diese Funktion der Enterprise-Variante vorbehalten ist; trifft das auch auf die Version 2.0 zu?

2. Gibt es eine realistische Einschäftzung, wann die deutsche Übersetzung für Version 2.0 verfügbar sein wird?
1 Reply
dmc
Active Member

Re: V2.0 Indizierung von Dokumenten / dt. Übersetzung

Zur Ursachenforschung bei 1a: Ein Blick in das alfresco.log müsste weiterhelfen, mögliche Ursachen sind zuwenig Speicher, ein kopiergeschützes PDF oder ein Problem der PDFBox Bibliothek, die zur Text-Extraktion genutzt wird.

>1b. Wie kann ich den Index neu erstellen lassen?
Die Konfigurationsoption ist index.recovery.mode=FULL, vorher muss das Verzeichnis lucene-indexes im Alfresco dir.root entfernt werden.
Das muss man nach dem Index-Rebuild aber auch wieder auskommentieren.

>In einem Beitrag, der schon etliche Monate alt ist, las ich, dass diese >Funktion der Enterprise-Variante vorbehalten ist; trifft das auch auf die >Version 2.0 zu?
So eine Funktionseinschränkung ist mir nicht bekannt. Auf forums.alfresco.com?

>2. Gibt es eine realistische Einschäftzung, wann die deutsche Übersetzung für Version 2.0 verfügbar sein wird?
Siehe http://forum.alfresco.de/forum/showthread.php?t=6

knutella