Macro pour lire page source html sur le web
Résolu
J-Luc
-
J-Luc -
J-Luc -
Bonjour,
Je suis sous Linux Mint 17.1. J'utilise LibreOffice Calc Version: 4.2.7.2 Build ID: 420m0(Build:2).
J'ai écrit une macro en basic pour libre le code source d'une page HTML sur le web. Voici la manière dont je procède:
open monurl for input as #1
line input #1,ligne
page_html = ligne
do while not eof(#1)
line input #1,ligne
page_html = page_html & ligne
loop
close #1
Quand j'analyse la chaine de données dans page_html, je m'aperçois que les caractères accentués et le ç ont été transformés en caractère code 65533.
Je n'ai aucun problème pour visualiser le source de la même page dans Firefox.
Quelqu'un aurait-il une piste pour résoudre ce problème ? Y a-t-il un paramètre à positionner dans LibreOffice ?
Merci par avance de toute réponse.
Je suis sous Linux Mint 17.1. J'utilise LibreOffice Calc Version: 4.2.7.2 Build ID: 420m0(Build:2).
J'ai écrit une macro en basic pour libre le code source d'une page HTML sur le web. Voici la manière dont je procède:
open monurl for input as #1
line input #1,ligne
page_html = ligne
do while not eof(#1)
line input #1,ligne
page_html = page_html & ligne
loop
close #1
Quand j'analyse la chaine de données dans page_html, je m'aperçois que les caractères accentués et le ç ont été transformés en caractère code 65533.
Je n'ai aucun problème pour visualiser le source de la même page dans Firefox.
Quelqu'un aurait-il une piste pour résoudre ce problème ? Y a-t-il un paramètre à positionner dans LibreOffice ?
Merci par avance de toute réponse.
A voir également:
- Createunoservice
- Lire le coran en français pdf - Télécharger - Histoire & Religion
- Lire epub sur pc - Guide
- Comment supprimer une page sur word - Guide
- Web office - Guide
- Telecharger macro convertir chiffre en lettre excel - Télécharger - Tableur
1 réponse
Sans voir le fichier HTML, il est toujours délicat d'apporter une réponse.
Une ouverture en mode binaire pourrait peut être être une solution :
https://forum.openoffice.org/fr/forum/ftopic2372.html
.
Une ouverture en mode binaire pourrait peut être être une solution :
https://forum.openoffice.org/fr/forum/ftopic2372.html
.
Effectivement j'ai procédé de la manière suivante:
sf = createUnoService("com.sun.star.ucb.SimpleFileAccess")
fileStream = sf.openFileRead(monurl)
myTextFile = createUnoService("com.sun.star.io.TextInputStream")
myTextFile.InputStream = fileStream
myTextFile.Encoding = "ISO-8859-15"
page_html = ""
Do while not myTextFile.IsEOF
ligne = myTextFile.readLine
page_html = page_html & ligne
Loop
fileStream.closeInput
myTextFile.closeInput
et j'obtiens le source avec les accents et les ç.
Encore merci.
J-Luc