Chercher et extraire dans un dump (?) en .xml

Fermé
Grulon - 23 mars 2012 à 19:14
 Grulon - 23 mars 2012 à 19:15
Bonjour,

Je suis trèèès novice en la matière.
Je résume ma situation.
Je dois extraire des milliers de titres d'ouvrages depuis un catalogue contenant des fiches sur des ouvrages, et ceci en vue d'en faire un dictionnaire.
Sur les conseils de la BNF, j'ai donc récupéré leur catalogue. Ce sont des dizaines de milliers de pages en .xml dans 165 fichiers nommés dump_works*.xml
En bref, j'ai besoin de pouvoir extraire dans un simple fichier .txt tout ce qui se trouve entre les balises <dc:title>*</dc:title> dans ces fichiers .xml.
Et je n'ai malheureusement aucune idée de comment m'y prendre.
J'ai tenté de récupérer BaseX et de faire une QueryX.. Qui ne me renvoie rien.

Si quelqu'un pouvait m'aider à faire ça quelque part avant le 4 avril, parce qu'après quelques heures à pas bien comprendre ce que je faisais sans résultat je me sens mal parti, je l'en remercierais grandement!
A voir également:

1 réponse

Je précise tout de même que je ne tiens pas à faire ceci avec BaseX, si quelqu'un connaît une méthode quelconque qui me permettrait de faire ça sans tout copier/coller à la main, ça me va :D
0