Macro pour lire page source html sur le web [Résolu/Fermé]

Signaler
-
 J-Luc -
Bonjour,
Je suis sous Linux Mint 17.1. J'utilise LibreOffice Calc Version: 4.2.7.2 Build ID: 420m0(Build:2).
J'ai écrit une macro en basic pour libre le code source d'une page HTML sur le web. Voici la manière dont je procède:
open monurl for input as #1
line input #1,ligne
page_html = ligne
do while not eof(#1)
line input #1,ligne
page_html = page_html & ligne
loop
close #1

Quand j'analyse la chaine de données dans page_html, je m'aperçois que les caractères accentués et le ç ont été transformés en caractère code 65533.
Je n'ai aucun problème pour visualiser le source de la même page dans Firefox.
Quelqu'un aurait-il une piste pour résoudre ce problème ? Y a-t-il un paramètre à positionner dans LibreOffice ?
Merci par avance de toute réponse.


1 réponse

Messages postés
3735
Date d'inscription
jeudi 20 mars 2008
Statut
Membre
Dernière intervention
22 octobre 2020
902
Sans voir le fichier HTML, il est toujours délicat d'apporter une réponse.
Une ouverture en mode binaire pourrait peut être être une solution :
https://forum.openoffice.org/fr/forum/ftopic2372.html


.
Merci pour la réponse.
Effectivement j'ai procédé de la manière suivante:
sf = createUnoService("com.sun.star.ucb.SimpleFileAccess")
fileStream = sf.openFileRead(monurl)
myTextFile = createUnoService("com.sun.star.io.TextInputStream")
myTextFile.InputStream = fileStream
myTextFile.Encoding = "ISO-8859-15"
page_html = ""
Do while not myTextFile.IsEOF
ligne = myTextFile.readLine
page_html = page_html & ligne
Loop

fileStream.closeInput
myTextFile.closeInput

et j'obtiens le source avec les accents et les ç.

Encore merci.

J-Luc