Inteliant OCR

cancel
Showing results for 
Search instead for 
Did you mean: 
no-name
Member II

Inteliant OCR

Bueno esto es para haceros saver que existe un OCR con predisposicion a adaptarse a las necesidades de nuestro alfresco, se llama intelliant OCR
la web es http://www.intelliant.fr

Todo esto tiene un pero, hay que configurarlo, cuando se instala nos deja una carpeta llamada alfresco con dos XML que hay que configurar para poder usarlos con alfresco, esta solucion es para Windows. yo de momento intentare configurarlo, y buscare tambien un OCR para linux.

(esta descargable desde la web tambien aviso de que para usarlo hay que comprarlo)

Si alguien ya a usado esta solucion agradeceria saver como lo hizo.

Un saludo y que sea util.
7 Replies
ajv
Member II

Re: Inteliant OCR

Hola,

Precisamente este fin de semana quería echarle un vistazo a esta solución, pero no se encuentra disponible para descargar (o bien, no he ido al sitio adecuado).
Tenía pensado que la integración con Alfresco era gratuita y se podía bajar desde: http://www.intelliant.fr/downloads/alfresco-starter-1.0.exe

Si alguien descubre algo sobre este tema…
Gracias!
no-name
Member II

Re: Inteliant OCR

Bueno simplemente aclararte que la empresa intelliant no parece ser muy seria ya que yo les he mandado dos mails (en un correcto ingles) y una peticion de que me llamaran ya de forma desesperada, y no han echo ningun caso.

Lo que si que puedo decirte es que si te bajas la version que esta disponible en http://www.intelliant.fr/downloads/ una vez terminado de intalar te metes en su carpeta y encontraras una que se llama alfresco con un readme (muy poco util la verdad) y dos archivos xml que todavia estoy descifranco como configurar, porque sin manuales ni nada no se ni por donde me da el aire
no-name
Member II

Re: Inteliant OCR

Bueno pues despues de experimentar tengo claras dos cosas:
hay que mover los archivos XML a C:\Alfresco\tomcat\shared\classes\alfresco\extension
y editar el web-client-config-custom.xml añadiendo una linea (la que te viene en el otro archivo XML).

Despues hay que modificar los repositorios para añadirle el programa de OCR.

y en teoria una vez realizados estos cambios en las reglas de contenidos podriamos mandarle modificar los tif a pdf y claro esta hacer un OCR sobre el contenido de ciertas carpetas.

Agradeceria una explicacion de como modificar los repositorios de alfresco, porque e leido la documentacion oficial y no me he enterado demasiaodo.


Gracias de antemano
jlabuelo
Active Member

Re: Inteliant OCR

Buenos días

Yo también estoy buscando un OCR que se integre con Alfresco 3. Acabo de bajar el OCR Intelliant y aún no lo he probado, pero veo que vosotros ya estais trabajando en ello.
¿Que tal os ha ido? ¿Ha funcionado correctamente? ¿Os ha dado muchos problemas?

Yo hasta ahora lo único que he hecho ha sido bajarmelo, y seguir los pasos del artículo de la Wiki que dicen que hay que colocar un fichero XML en alfresco/tomcat/shared/classes/extension "ocr-transformers-context.xml" y modificar el Web-client-config-custom.xml añadiendole un par de líneas…. a ver si es tan fácil como dicen.

Otra cosa que quería preguntaros… habéis encontrado un software OCR que pueda integrarse con Alfresco y que se pueda realizar en Linux? nosotros solemos usar Ubuntu y tener que migrar a Windows por el OCR nos sería un engorro.

Ya me comentais, muchas gracias y un saludo

Jose Luis
jmedalhas
Member II

Re: Inteliant OCR

Buenos dias, soy un estudiante y estoy intentando integrar intelliant en mi alfresco. He estado siguiendo vuestras indicaciones de este foro, tambien e intentado encontrar el wiki al que haceis referencia aqui pero no lo e encontrado. Yo sigo los pasos del foro pero cuando intento accecer a mi alfresco me da fallo, creo (bueno se) que algo no estoy haciendo bien.Si pudierais indicarme el enlace del wiki para poder hacer la integracion os lo agradeceria.
svalle
Member II

Re: Inteliant OCR

Buenas,

Por lo que entiendo de la versión francesa del sitio internet la version de Alfresco que soportan es la 1.4. Un poco desfasado, no?

Contenu de la suite (taille 50 Mo environ) :

    * Alfresco Version Community Network 1.4 Preview.
    * Serveur Internet Tomcat.
    * Base de données Hypersonic SQL.
    * Intelliant OCR 1.1 préintégré.
    * Utilitaire destiné à faciliter l'accès aux principales fonctions d'Alfresco, intégré à la barre des tâches de Windows.
agey
Member II

Re: Inteliant OCR

Hola,

Yo estoy utilizando el Intelliant OCR integrado con Alfresco versión 3.0 y en principio funciona. Tengo configurada una Scheduled Action para que se ejecute todos los días por la noche para pasar el OCR a todos los ficheros TIFF que se encuentran en un espacio. Normalmente esto va perfecto pero algunas veces se queda bloqueado procesando un fichero y llega a saturar el servidor. En el log de Alfresco no se registra ningún error, simplemente se queda ejecutando la acción pero no finaliza. En el administrador de tareas de Windows se puede ver que el proceso tiger32 se está ejecutando y consume un 99 de CPU. Tengo que terminar este proceso para poder trabajar de nuevo con Alfresco.

Si descargo el fichero TIFF y ejecuto el OCR por linea de comandos sobre el fichero, el OCR no da ningún problema y lo procesa perfectamente.

En la configuración de la Scheduled Action he establecido la propiedad 'transactionMode' como 'ISOLATED_TRANSACTIONS' para que, en caso de error, la acción se siga ejecutando para el resto de ficheros. Pero esto realmente no me soluciona el bloqueo ya que no produce error.

Configuración Scheduled Action:

    <bean id="programTransformOCR" class="org.alfresco.repo.action.scheduled.CronScheduledQueryBasedTemplateActionDefinition">
            <property name="transactionMode">
                <value>ISOLATED_TRANSACTIONS</value>
            </property>
            <property name="compensatingActionMode">
                <value>IGNORE</value>
            </property>
            <property name="searchService">
                <ref bean="SearchService"/>
            </property>
            <property name="templateService">
                <ref bean="TemplateService"/>
            </property>
            <property name="queryLanguage">
                <value>lucene</value>
            </property>
            <property name="stores">
                <list>
                    <value>workspace://SpacesStore</value>
                </list>
            </property>
            <!– Find all nodes that do not have the aspect –>
            <property name="queryTemplate">
                <value>+PATH:"/app:company_home/cm:Clientes/*//*" +TYPE:"{custom.model}Recorte" +@\{http\://www.alfresco.org/model/content/1.0\}content.mimetype:image/tiff</value>
            </property>
            <property name="cronExpression">
                <!–<value>0 */3 * * * ?</value>–>  
             <value>0 0 21 * * ?</value>     
                <!–<value>0 0 14 ? * SAT</value>–>
            </property>
            <property name="jobName">
                <value>jobA</value>
            </property>
            <property name="jobGroup">
                <value>jobGroup</value>
            </property>
            <property name="triggerName">
                <value>triggerA</value>
            </property>
            <property name="triggerGroup">
                <value>triggerGroup</value>
            </property>
            <!– Inject the scheduler - the trigger will be registered with this scheduler –>
            <property name="scheduler">
                <ref bean="schedulerFactory"/>
            </property>
            <property name="actionService">
                <ref bean="ActionService"/>
            </property>
            <property name="templateActionModelFactory">
                <ref bean="templateActionModelFactory"/>
            </property>
            <property name="templateActionDefinition">
                <ref bean="transformPdfOCR"/>
            </property>
            <property name="transactionService">
                <ref bean="TransactionService"/>
            </property>
            <property name="runAsUser">
                <value>admin</value>
            </property>
        </bean>

¿A alguien se le ocurre como puedo solucionar o controlar los bloqueos del OCR? Lo que quisiera conseguir es registrar en el log los ficheros en los que el OCR quedó bloqueado pero que continuase con el resto para no acumular ficheros a procesar, ya que diariamente serían alrededor de 100 ficheros y se suele bloquear en el primero que procesa.

Muchas gracias,