Macro pour lire page source html sur le web

Résolu/Fermé
J-Luc - 20 avril 2015 à 13:42
 J-Luc - 24 avril 2015 à 17:14
Bonjour,
Je suis sous Linux Mint 17.1. J'utilise LibreOffice Calc Version: 4.2.7.2 Build ID: 420m0(Build:2).
J'ai écrit une macro en basic pour libre le code source d'une page HTML sur le web. Voici la manière dont je procède:
open monurl for input as #1
line input #1,ligne
page_html = ligne
do while not eof(#1)
line input #1,ligne
page_html = page_html & ligne
loop
close #1

Quand j'analyse la chaine de données dans page_html, je m'aperçois que les caractères accentués et le ç ont été transformés en caractère code 65533.
Je n'ai aucun problème pour visualiser le source de la même page dans Firefox.
Quelqu'un aurait-il une piste pour résoudre ce problème ? Y a-t-il un paramètre à positionner dans LibreOffice ?
Merci par avance de toute réponse.


A voir également:

1 réponse

OOoForum Messages postés 3865 Date d'inscription jeudi 20 mars 2008 Statut Membre Dernière intervention 3 novembre 2023 960
24 avril 2015 à 09:02
Sans voir le fichier HTML, il est toujours délicat d'apporter une réponse.
Une ouverture en mode binaire pourrait peut être être une solution :
https://forum.openoffice.org/fr/forum/ftopic2372.html


.
0
Merci pour la réponse.
Effectivement j'ai procédé de la manière suivante:
sf = createUnoService("com.sun.star.ucb.SimpleFileAccess")
fileStream = sf.openFileRead(monurl)
myTextFile = createUnoService("com.sun.star.io.TextInputStream")
myTextFile.InputStream = fileStream
myTextFile.Encoding = "ISO-8859-15"
page_html = ""
Do while not myTextFile.IsEOF
ligne = myTextFile.readLine
page_html = page_html & ligne
Loop

fileStream.closeInput
myTextFile.closeInput

et j'obtiens le source avec les accents et les ç.

Encore merci.

J-Luc
0