Bonjour,
J'aimerais stocker des images mais les indexer sur base d'un contenu textuel (contenu textuel déposé ou non dans Alfresco). En fait ces images proviennent du scannage de courriers "papier". Une opération OCR en extrait le contenu textuel et j'aimerais utiliser ce contenu pour indexer les images car seules les images sont destinées à être consultées par les utilisateurs. J'aimerais que l'opération d'OCR puisse se faire en dehors d'Alfresco, avant de stocker l'image dans Alfresco.
Est-ce possible de faire cela avec Alfresco?
Dans la documentation d'Alfresco, j'ai bien vu qu'on pouvait intervenir sur l'indexation en installant un service "custom" de "content transformation" qui prendra en charge la transformation du contenu du fichier à indexer en contenu textuel, contenu textuel utilisé pour l'indexation. Cependant, les méthodes à implémenter (méthodes définies dans l'interface "AbstractContentTransformer" ne reçoivent qu'un "reader" sur le contenu de l'objet à indexer. Il nous aurait fallu au minimum aux métadonnées de l'objet à indexer (connaissant le nom du fichier à indexer nous aurions pu aller chercher hors Alfresco le contenu textuel résultat de l'opération d'OCR réalisée auparavant).
Merci de votre aide,
André