OCRmypdf

cancel
Showing results for 
Search instead for 
Did you mean: 
denis10
Active Member

OCRmypdf

Bonjour,

je viens d'installer le module OCRmypdf.

L'installation s'est fais correctement et lorsque je clique sur le bouton OCR, un message m'indique que le fichier est bien pris en compte.

Mais après ça, rien ne se passe. Dans les logs, il y a bien une erreur.

Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 7, in <module>
from ocrmypdf.__main__ import run_pipeline
File "/usr/local/lib/python3.5/dist-packages/ocrmypdf/__main__.py", line 70, in <module>
verify_python3_env(
at es.keensoft.alfresco.ocr.OCRTransformWorker.transform(OCRTransformWorker.java:86)
at es.keensoft.alfresco.ocr.OCRExtractAction.executeImplInternal(OCRExtractAction.java:181)
... 10 more
Caused by: org.alfresco.service.cmr.repository.ContentIOException: 06270103 Failed to perform OCR transformation:
Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 7, in <module>
from ocrmypdf.__main__ import run_pipeline
File "/usr/local/lib/python3.5/dist-packages/ocrmypdf/__main__.py", line 70, in <module>
verify_python3_env(
at es.keensoft.alfresco.ocr.OCRTransformWorker.transform(OCRTransformWorker.java:79)
... 11 more

Je lance donc la commande manuellement en ligne de commande et le documents océrisé fonctionne bien.

Avez vous déjà eu ce problème ?

5 Replies
ycoulon
Alfresco Employee

Re: OCRmypdf

Bonjour,

L'execution de ocrmypdf semble échoué à cause d'une erreur lié à python. Je note que l'utilisateur faisant tourné tomcat utilise python3.

Lors de vos tests manuel avez-vous utilisé cette même version ?

Y.

denis10
Active Member

Re: OCRmypdf

Bonjour, 

Je viens de regarder la version de python installé, je suis en Python 2.7.12.

Pensé vous que je dois mettre a jour Python ?

En récupérant la ligne de commande qui est dans le log d'erreur :

/usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf

La commande se lance correctement et j'ai alors un document océrisé. Mais je suis obligé de récupérer la commande dans le log pour que cela fonctionne.

Merci pour votre réponse.

EDIT : 

J'ai maintenant Python en 3.5.2

Le problème persiste. Un idée ?

Zizou27
Member II

Re: OCRmypdf

Bonjour @ycoulon 

 

j'utilise ocrmypdf avec alfresco et l'action ocr ne fonctionne pas, sachant que ocrmypdf fonctionne bien avec la commande.

logs :

Caused by: java.lang.RuntimeException: org.alfresco.service.cmr.repository.ContentIOException: 000817996 Failed to perform OCR transformation:
Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_4887267237326407155.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_4887267237326407155_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 5, in
from ocrmypdf.main import run
File "/root/.local/lib/python3.6/site-packages/ocrmypdf/init.py", line 20, in
from .api import Verbosity
at es.keensoft.alfresco.ocr.OCRExtractAction.executeImplInternal(OCRExtractAction.java:183)
at es.keensoft.alfresco.ocr.OCRExtractAction.access$200(OCRExtractAction.java:38)
at es.keensoft.alfresco.ocr.OCRExtractAction$1.execute(OCRExtractAction.java:164)
at es.keensoft.alfresco.ocr.OCRExtractAction$1.execute(OCRExtractAction.java:161)
at org.alfresco.repo.transaction.RetryingTransactionHelper.doInTransaction(RetryingTransactionHelper.java:464)
at es.keensoft.alfresco.ocr.OCRExtractAction.executeInNewTransaction(OCRExtractAction.java:169)
at es.keensoft.alfresco.ocr.OCRExtractAction.access$100(OCRExtractAction.java:38)
at es.keensoft.alfresco.ocr.OCRExtractAction$ExtractOCRTask.run(OCRExtractAction.java:151)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:748)

 

ycoulon
Alfresco Employee

Re: OCRmypdf

Bonjour,

 

L'exception semble indiqué un problème avec le contenu à transformer (ContentIOException).

Il faudrait se rapprocher des personnes ayant réaliser le développement de cette action afin d'investiguer plus en détail sur cette erreur.

Je n'ai pas mis en oeuvre cette action ne serait donc pas d'un grand secours sur ce sujet pour le moment. Si je trouve le temps de faire des tests je vous tiendrais au courant.

 

Y.

Zizou27
Member II

Re: OCRmypdf

Merci @ycoulon