Chercher et extraire dans un dump (?) en .xml
Grulon
-
Grulon -
Grulon -
Bonjour,
Je suis trèèès novice en la matière.
Je résume ma situation.
Je dois extraire des milliers de titres d'ouvrages depuis un catalogue contenant des fiches sur des ouvrages, et ceci en vue d'en faire un dictionnaire.
Sur les conseils de la BNF, j'ai donc récupéré leur catalogue. Ce sont des dizaines de milliers de pages en .xml dans 165 fichiers nommés dump_works*.xml
En bref, j'ai besoin de pouvoir extraire dans un simple fichier .txt tout ce qui se trouve entre les balises <dc:title>*</dc:title> dans ces fichiers .xml.
Et je n'ai malheureusement aucune idée de comment m'y prendre.
J'ai tenté de récupérer BaseX et de faire une QueryX.. Qui ne me renvoie rien.
Si quelqu'un pouvait m'aider à faire ça quelque part avant le 4 avril, parce qu'après quelques heures à pas bien comprendre ce que je faisais sans résultat je me sens mal parti, je l'en remercierais grandement!
Je suis trèèès novice en la matière.
Je résume ma situation.
Je dois extraire des milliers de titres d'ouvrages depuis un catalogue contenant des fiches sur des ouvrages, et ceci en vue d'en faire un dictionnaire.
Sur les conseils de la BNF, j'ai donc récupéré leur catalogue. Ce sont des dizaines de milliers de pages en .xml dans 165 fichiers nommés dump_works*.xml
En bref, j'ai besoin de pouvoir extraire dans un simple fichier .txt tout ce qui se trouve entre les balises <dc:title>*</dc:title> dans ces fichiers .xml.
Et je n'ai malheureusement aucune idée de comment m'y prendre.
J'ai tenté de récupérer BaseX et de faire une QueryX.. Qui ne me renvoie rien.
Si quelqu'un pouvait m'aider à faire ça quelque part avant le 4 avril, parce qu'après quelques heures à pas bien comprendre ce que je faisais sans résultat je me sens mal parti, je l'en remercierais grandement!
A voir également:
- Chercher et extraire dans un dump (?) en .xml
- Extraire une video youtube - Guide
- Xml download - Télécharger - Édition & Programmation
- Extraire le son d'une vidéo - Guide
- Extraire image pdf - Guide
- Office xml handler - Télécharger - Traitement de texte