Python : modifier balise html contenu ds var.

Mamy -  
sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   -
Bonjour,

Je possède une variable python contenant le code d'une page html
maVariable=<html xmlns="http://www.w3.org/1999/xhtml"><head>...

J'aimerais trouver la balise <title> et la remplacer par <title>Coucou.

Ainsi, j'aurai mon titre de page + le texte Coucou

Comment peut on faire ça avec python ?

J'ai essayé le re.sub sans succès...

Merci d'avance
Configuration: Windows XP
Firefox 2.0.0.13

1 réponse

  1. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Tu peux effectivement utiliser re.sub, ou bien beautifulsoup (un peu lent, mais marche bien).

    Petit exemple de remplacement avec BeautifulSoup (à adapter):

    import BeautifulSoup
    htmlpage = open('mapage.html','rb').read()
    soup = BeautifulSoup.BeautifulSoup(htmlpage)
    soup.done()
    for titre in soup('span',{'class' : ['comptitle','titre']}):
        titre.name = 'h1'   # Convert span to h1
        del titre['class']  # Remove class
    
    0