[PHP] Enlever les balites <script> d'une page
Résolu
engies
-
engies -
engies -
Bonjour,
Je suis actuellement entrain de faire un moteur de recherche et j'ai un pitit problème :(
Je suis entrain de corriger les bugs dans mon indexeur mais je n'arrive pas à supprimer tout le code javascript des pages ....
Voici un exemple de code html qui produit cette erreur:
et le bout du code php qui le filtre:
Donc si quelqu'un a une idée, ce serait gentil de me la donner...
Je suis actuellement entrain de faire un moteur de recherche et j'ai un pitit problème :(
Je suis entrain de corriger les bugs dans mon indexeur mais je n'arrive pas à supprimer tout le code javascript des pages ....
Voici un exemple de code html qui produit cette erreur:
<strong class="liens_invites">Inscription</strong><br />
<p>Inscription rapide en 2 minutes</p>
<p class="bloc_connexion">
<a href="connexion.html">
<strong class="liens_invites">Connexion</strong><br />
Utilisez votre compte
</a>
<a class="rpxnow" onclick="return false;" href="http://site-du-zero.rpxnow.com/..." rel="nofollow"><img src="Templates/images/designs/2/rpx_icons.png" alt="connexion_rpx" /></a>
<script type="text/javascript">
var rpxJsHost = (("https:" == document.location.protocol) ? "[[https://]]" : "http://static.");
document.write(unescape("%3Cscript src='" + rpxJsHost +
"rpxnow.com/js/lib/rpx.js' type='text/javascript'%3E%3C/script%3E"));
</script>
<script type="text/javascript">
RPXNOW.overlay = true;
RPXNOW.language_preference = 'fr';
</script>
</p>
et le bout du code php qui le filtre:
//On enlève tous les codes js.
$this->contenu = preg_replace("#<script.*>.*</script>#isUm", " ", $this->contenu);
//On enlève les styles.
$this->contenu = preg_replace("#<style.*>.*</style>#isUm", " ", $this->content);
//On enlève tous les liens et leurs contenu car il n'ont pas
//d'information sur cette page.
$this->contenu = preg_replace("#<a.*>.*</a>#isUm", " ", $this->contenu);
//On enlève les balistes unique.
$this->contenu = preg_replace("#<[^<]+\s*/>#isUm", " ", $this->contenu);
$this->contenu = preg_replace("#<br>|<hr>#isUm", " ", $this->contenu);
Donc si quelqu'un a une idée, ce serait gentil de me la donner...
A voir également:
- [PHP] Enlever les balites <script> d'une page
- Supprimer une page word - Guide
- Script vidéo youtube - Guide
- Enlever pub youtube - Accueil - Streaming
- Imprimer tableau excel sur une page - Guide
- Créer une page facebook - Guide
3 réponses
Bonjour,
Quel problème as tu exactement ?
As tu remarqué qu'a ton second remplacement tu utilises "$this->content" au lien de "$this->contenu" ?
Il y a seulement 10 types de personnes, ceux qui comprennent le binaire, et les autres...
Quel problème as tu exactement ?
As tu remarqué qu'a ton second remplacement tu utilises "$this->content" au lien de "$this->contenu" ?
//On enlève les styles.
$this->contenu = preg_replace("#<style.*>.*</style>#isUm", " ", $this->content);
Il y a seulement 10 types de personnes, ceux qui comprennent le binaire, et les autres...