Macro pour lire page source html sur le web

Résolu
J-Luc -  
 J-Luc -
Bonjour,
Je suis sous Linux Mint 17.1. J'utilise LibreOffice Calc Version: 4.2.7.2 Build ID: 420m0(Build:2).
J'ai écrit une macro en basic pour libre le code source d'une page HTML sur le web. Voici la manière dont je procède:
open monurl for input as #1
line input #1,ligne
page_html = ligne
do while not eof(#1)
line input #1,ligne
page_html = page_html & ligne
loop
close #1

Quand j'analyse la chaine de données dans page_html, je m'aperçois que les caractères accentués et le ç ont été transformés en caractère code 65533.
Je n'ai aucun problème pour visualiser le source de la même page dans Firefox.
Quelqu'un aurait-il une piste pour résoudre ce problème ? Y a-t-il un paramètre à positionner dans LibreOffice ?
Merci par avance de toute réponse.


A voir également:

1 réponse

OOoForum Messages postés 3873 Date d'inscription   Statut Membre Dernière intervention   961
 
Sans voir le fichier HTML, il est toujours délicat d'apporter une réponse.
Une ouverture en mode binaire pourrait peut être être une solution :
https://forum.openoffice.org/fr/forum/ftopic2372.html


.
0
J-Luc
 
Merci pour la réponse.
Effectivement j'ai procédé de la manière suivante:
sf = createUnoService("com.sun.star.ucb.SimpleFileAccess")
fileStream = sf.openFileRead(monurl)
myTextFile = createUnoService("com.sun.star.io.TextInputStream")
myTextFile.InputStream = fileStream
myTextFile.Encoding = "ISO-8859-15"
page_html = ""
Do while not myTextFile.IsEOF
ligne = myTextFile.readLine
page_html = page_html & ligne
Loop

fileStream.closeInput
myTextFile.closeInput

et j'obtiens le source avec les accents et les ç.

Encore merci.

J-Luc
0