[PHP] Enlever les balites <script> d'une page
Résolu
engies
-
engies -
engies -
Bonjour,
Je suis actuellement entrain de faire un moteur de recherche et j'ai un pitit problème :(
Je suis entrain de corriger les bugs dans mon indexeur mais je n'arrive pas à supprimer tout le code javascript des pages ....
Voici un exemple de code html qui produit cette erreur:
et le bout du code php qui le filtre:
Donc si quelqu'un a une idée, ce serait gentil de me la donner...
Je suis actuellement entrain de faire un moteur de recherche et j'ai un pitit problème :(
Je suis entrain de corriger les bugs dans mon indexeur mais je n'arrive pas à supprimer tout le code javascript des pages ....
Voici un exemple de code html qui produit cette erreur:
<strong class="liens_invites">Inscription</strong><br /> <p>Inscription rapide en 2 minutes</p> <p class="bloc_connexion"> <a href="connexion.html"> <strong class="liens_invites">Connexion</strong><br /> Utilisez votre compte </a> <a class="rpxnow" onclick="return false;" href="http://site-du-zero.rpxnow.com/..." rel="nofollow"><img src="Templates/images/designs/2/rpx_icons.png" alt="connexion_rpx" /></a> <script type="text/javascript"> var rpxJsHost = (("https:" == document.location.protocol) ? "[[https://]]" : "http://static."); document.write(unescape("%3Cscript src='" + rpxJsHost + "rpxnow.com/js/lib/rpx.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/javascript"> RPXNOW.overlay = true; RPXNOW.language_preference = 'fr'; </script> </p>
et le bout du code php qui le filtre:
//On enlève tous les codes js. $this->contenu = preg_replace("#<script.*>.*</script>#isUm", " ", $this->contenu); //On enlève les styles. $this->contenu = preg_replace("#<style.*>.*</style>#isUm", " ", $this->content); //On enlève tous les liens et leurs contenu car il n'ont pas //d'information sur cette page. $this->contenu = preg_replace("#<a.*>.*</a>#isUm", " ", $this->contenu); //On enlève les balistes unique. $this->contenu = preg_replace("#<[^<]+\s*/>#isUm", " ", $this->contenu); $this->contenu = preg_replace("#<br>|<hr>#isUm", " ", $this->contenu);
Donc si quelqu'un a une idée, ce serait gentil de me la donner...
A voir également:
- [PHP] Enlever les balites <script> d'une page
- Supprimer une page word - Guide
- Script vidéo youtube - Guide
- Enlever pub youtube - Accueil - Streaming
- Imprimer tableau excel sur une page - Guide
- Créer une page facebook - Guide
3 réponses
Bonjour,
Quel problème as tu exactement ?
As tu remarqué qu'a ton second remplacement tu utilises "$this->content" au lien de "$this->contenu" ?
Il y a seulement 10 types de personnes, ceux qui comprennent le binaire, et les autres...
Quel problème as tu exactement ?
As tu remarqué qu'a ton second remplacement tu utilises "$this->content" au lien de "$this->contenu" ?
//On enlève les styles. $this->contenu = preg_replace("#<style.*>.*</style>#isUm", " ", $this->content);
Il y a seulement 10 types de personnes, ceux qui comprennent le binaire, et les autres...