Python : modifier balise html contenu ds var.

Mamy -  
sebsauvage Messages postés 33415 Statut Modérateur -
Bonjour,

Je possède une variable python contenant le code d'une page html
maVariable=<html xmlns="http://www.w3.org/1999/xhtml"><head>...


J'aimerais trouver la balise <title> et la remplacer par <title>Coucou.


Ainsi, j'aurai mon titre de page + le texte Coucou

Comment peut on faire ça avec python ?

J'ai essayé le re.sub sans succès...


Merci d'avance

1 réponse

sebsauvage Messages postés 33415 Statut Modérateur 15 663
 
Tu peux effectivement utiliser re.sub, ou bien beautifulsoup (un peu lent, mais marche bien).


Petit exemple de remplacement avec BeautifulSoup (à adapter):

import BeautifulSoup
htmlpage = open('mapage.html','rb').read()
soup = BeautifulSoup.BeautifulSoup(htmlpage)
soup.done()
for titre in soup('span',{'class' : ['comptitle','titre']}):
    titre.name = 'h1'   # Convert span to h1
    del titre['class']  # Remove class
0