[résolu]import massif pour initialiser l'entrepôt de données

cancel
Showing results for 
Search instead for 
Did you mean: 
gregb
Member II

[résolu]import massif pour initialiser l'entrepôt de données

bonjour,

nous réalisons un pilote alfresco.

Nous partons de zero, pas de GED existante.

on a 8000 documents à importer.

j'ai fait un test tout bête: j'ai créé un zip sur un échantillon de documents (avec une petite arborescence).
j'ai fait un import de ce ZIP.
l'arborescence d'espaces s'est bien constituée, les documents sont dans les espaces voulus.

Un seul problème mais de taille: les caractères accentués ne passent pas , autant pour les nom d'espaces que pour les noms de document et leur contenu.
y-a-t'il une solution pour contourner ce problème?
ou une autre solution pour importer les données en masse?
je précise que je n'ajoute pas de nouvelles meta données et que quand j'ajoute du contenu unitairement via l'IHM, tout fonctionne normalement.

Merci d'avance
6 Replies
rguinot
Customer

Re: [résolu]import massif pour initialiser l'entrepôt de données

Bonjour,

A la lecture de votre cas, je vous suggèrerais de réaliser l'import en une seule fois via FTP.
Comme vous le savez peut être, Alfresco permet l'accès à son repository via de nombreux protocoles tels que CIFS, FTP, WebDAV, NFS …

Si vous n'avez aucune métadonnée, vous n'avez qu'a créer l'arborescence cible sur votre filesystem local, puis copier l'ensemble par ftp dans le repository.

Les métadonnées "standard" tels que le titre, l'auteur , etc… des documents courants (MS Office,Open Office, PDF,…)  seront extraites automatiquement à l'import, quel que soit le protocole d'accès.

Concernant les problèmes d'accents, il s'agit probablement de problèmes d'encoding, mais vous ne précisez pas votre environnement de déploiement (OS, JVM, conteneur JBoss /Glassfish … ou Tomcat), au niveau client et serveur.
michaelh
Active Member

Re: [résolu]import massif pour initialiser l'entrepôt de données

Non accessoirement, partir en septembre 2008 sur la base d'une version 2.1 (si votre profil est exact), ça n'a pas trop de sens.
Je conseille à minima une version 3.0 Labs b
gregb
Member II

Re: [résolu]import massif pour initialiser l'entrepôt de données

concernant la version, j'aurai préféré la version entreprise.
mais pas de budget pour le premier lot.
le choix de la 2.1 provient du fait qu'on a eu quelques retours d'expérience sur cette version
il est évident que l'on ne restera pas longtemps sur cette version, du moins je l'espère.

pour notre environnement,  je suis sur Windows 2000 et tomcat 6

je ferai prochainement des tests sur red hat 4
gregb
Member II

Re: [résolu]import massif pour initialiser l'entrepôt de données

je viens de tester l'import par FTP.
ça marche pour les documents, mais ça ne marche pas pour les espaces qui devraient
avoir un caractère accentué dans leur nom
en fait l'espace est créé mais on a perdu l'accent et  tout ce qui devrait être dans ces espaces n'est pas importé.
rguinot
Customer

Re: [résolu]import massif pour initialiser l'entrepôt de données

il s'agit encore d'un problème d'encoding …

Quel client FTP utilisez vous ? Avez vous paramétré l'encoding ?
Quel encoding pour la base de données ?

ISO-8859-* devrait pourtant gérer les accents, sinon vous pouvez passer toute la chaîne en UTF-8.

Cela dit, je connais très mal l'environnement windows-ien (tant client que serveur), et encore moins windows 2000.
gregb
Member II

Re: [résolu]import massif pour initialiser l'entrepôt de données

en effet , nous l'avons envoyé à partir d'un poste unix avec ce charset et ça marche
merci