Comment changer le version de PDFBOX ?

cancel
Showing results for 
Search instead for 
Did you mean: 
magellank2
Member II

Comment changer le version de PDFBOX ?

Alfresco : 3.3 Community Edition
OS : W2003 Server

Bonjour,

Lors de l'ajout de fichier PDF assez volumineux dans Alfresco, j'obtiens ce message d'erreur dans la console TOMCAT :

ERROR [pdfbox.filter.FlateFilter] Stop reading corrupt stream

Ce qui fait que mes fichiers PDF ne sont pas totalement indexés (seulement une partie).

J'ai lu sur divers forums que cela provenait de la version de PDFBOX (en l'occurence : pdfbox-0.8.0-incubating-12-Nov-2009.jar) et qu'il fallait mieux utiliser la version 1.1.0.

J'ai téléchargé le v1.1.0 et l'ai mise en lieu et place de la v0.8.0.

Pas d'erreur au démarrage mais plus d'indexation du tout !

Faut il indiquer quelque part (dans un fichier de config) qu'on souhaite utiliser la v1.1.0 ?

Merci d'avance pour votre aide.
4 Replies
rivarola
Active Member

Re: Comment changer le version de PDFBOX ?

Bonjour,

En fait c'est beaucoup plus compliqué que ça : certains noms de paquetages ont changé donc il faut aussi mettre à jour la classe Java d'extracteur + mettre à jour le JAR fontbox il me semble.
magellank2
Member II

Re: Comment changer le version de PDFBOX ?

Bonjour et merci pour votre réponse.

il faut aussi mettre à jour la classe Java d'extracteur + mettre à jour le JAR fontbox

Comment puis-je faire cela ?
Ou puis-je trouver un mode opératoire ?

Merci d'avance.
magellank2
Member II

Re: Comment changer le version de PDFBOX ?

Bonjour,

Je me permets de relancer ce sujet.

Je vois sur le web des réponses variées mais aucune solution vraiment opérationnelle…

Une idée, un lien ?

Merci par avance.
rivarola
Active Member

Re: Comment changer le version de PDFBOX ?

Bonjour,

C'est du développement Java : il faut modifier (ou mieux, redéfinir dans un paquetage custom et surcharger dans la configuration) les classes PdfBoxMetadataExtracter et PdfBoxContentTransformer.