Javascript lire contenu page web

ponpon -  
erysoft Messages postés 42 Statut Membre -
Bonjour,
encore moi lol est ce que quelqu'un peut me dire coment lire le contenu d'une page web en javascript

Merci d'avance

11 réponses

  1. erysoft Messages postés 42 Statut Membre 5
     
    Salut,

    Je suis tombé sur cet article par hasard, et utilisant ce procédés depuis pas mal de temps, je dois vous dire que cela ne fonctionne que SUR le même domaine, et non en crossdomain. Je ne vois pas l'intérêt d'aller lire le code de nos pages html, puisque nous les avons sur le PC ! Enfin, c'est vous qui voyez !

    J'utilise la fonction javascript suivante :

    function eswd_charger_fichier(fichier, mode)
    {
    	var requete = null;
    	if (mode == undefined || mode == '') mode = false;
    	if (window.XMLHttpRequest) requete = new XMLHttpRequest();
    	else if (window.ActiveXObject) requete = new ActiveXObject("Microsoft.XMLHTTP");
    	else return;
    	requete.open('GET', fichier, mode);
    	requete.send(null);
    	return requete.responseText;
    }
    


    Elle est identique à celle déjà proposée, mais je ne fais pas le contrôle de réception.

    Pour ce qui est du cossdomain, il est impératif de passer par un proxy PHP, dont voici une exemple (xy.php) :

    <?php
    	$adresse    = $_GET['adr'];
    	$entete     = $_GET['ent'];
    	$conversion = $_GET['con'];
    	$adresse = str_replace('||','?',$adresse);
    	$adresse = str_replace('|||','&',$adresse);
    	switch ($entete)
    	{
    		case 'h' : $adresse = 'http://' . $adresse; break;
    		case 's' : $adresse = 'https://' . $adresse; break;
    		default  : break;
    	}
    	$session = curl_init($adresse);
    	curl_setopt($session, CURLOPT_HEADER, false);
    	curl_setopt($session, CURLOPT_RETURNTRANSFER, true);
    	$reponse = curl_exec($session);
    	curl_close($session);
    	if ($conversion == '1' || strtolower($conversion == 'true'))
    	{
    		$special   = array('<','>');
    		$caractere = array('<','>');
    		$reponse = str_replace($special,$caractere,$reponse);
    	}
    	header("Content-Type : text/xml");
    	echo $reponse; 
    ?>
    


    Pour avoir le code source de cette page, vous faites en javascript:

    alert(eswd_charger_fichier('http://www.erysoft.eu/xy.php?adr=www.commentcamarche.net/forum/affich-2098793-javascript-lire-contenu-page-web&ent=h', false));
    


    Vous pouvez essayer ceci :

    http://www.erysoft.eu/php/xy.php?adr=www.commentcamarche.net/forum/affich-2098793-javascript-lire-contenu-page-web&ent=h

    Dans ce cas, les balises sont opérationnelles. Mais si vous vous ajouter la conversion, vous aurez cela :

    http://www.erysoft.eu/php/xy.php?adr=www.commentcamarche.net/forum/affich-2098793-javascript-lire-contenu-page-web&ent=h&con=1

    Vous avez vu que la racine http:// ou https:// ne doit pas être présente dans l'adresse, car le serveur va déclarer une erreur. Si l''adresse que vous voulez lire est une fonction php, vous devez remplacer le ? d'origine par ||, et les & par |||.

    Amusez-vous bien !
    5
    1. erysoft Messages postés 42 Statut Membre 5
       
      $caractere = array('<','>');

      Pour des raisons d'affichage il faut remplacer '<' par '& l t ;', et '>' par '& g t ;'
      0
    2. erysoft Messages postés 42 Statut Membre 5
       
      Voilà la bonne syntaxe :
      $caractere = array('&lt','&gt;');
      0
  2. greg
     
    slt,

    Parcourt le DOM de la page que tu veut récupérer en javascript (getElementBy...).

    @+
    3
  3. ponpon
     
    En fait c'est une page HLTM et je veux la parcourir avec un script pour récupérer une valeur la en l'occurence c'est un numéro de tel
    0
  4. ponpon
     
    Si je demande c'est que ca me serait tres utile pour mon prog lol
    Mais bon si personne peut m'aider c'est pas grave google est mon ami le soir car la j'ai juste acces au site ccm
    0
  5. Vous n’avez pas trouvé la réponse que vous recherchez ?

    Posez votre question
  6. ponpon
     
    Bon bin je crois vraiment que personne peut m'aider
    Est irréalisable ??
    0
  7. petitjeremy
     
    Bonjour,

    oui, je sais que c'est réalisable ... je l'ai vu fonctionner sur du php ... donc sa devrai etre realisable sur du javascript ... sinon il faut utiliser l'ajax.

    je suis à la recherche de la même chose.

    donc en quelque mots, moi se que je rechercher c'est de pouvoir mettre le contenu d'une page dans une variable, pour pouvoir la scanner indépendament et donc tirer la valeur souhaité

    cordialement,

    Jeremy
    0
  8. petitjeremy
     
    Bonjour,

    apres reflexion, sachant que le javascript est un code client et non serveur. cela me parai difficielement realisable ...

    cordialement,
    0
    1. pff lol
       
      bordel mais certains disent vraiment n'importe quoi, c'est pathétique...
      abstenez vous de dire des aneries quand vous maitrisez pas! Guignols!
      0
      1. ptitjeremy > pff lol
         
        guignols, mdr ^^

        oula tu regardes des topic qui date de 2007 mon grand.
        au lieux de faire des réflection à la mord moi le noeud

        il aurait était plus intelligent de mettre une réponse.

        personnellement à l'époque je donnais des suppositions,
        "cela me parait"

        enfin bref, mon pauvre garçon

        à bonne entendeur salut

        sinon pour répondre

        utilise les fonctions :

        pour recupérer la page web dans une variable utilise un objet
        var xhr_object;

        function creerobjet(fichier)
        {
        if(window.XMLHttpRequest) // FIREFOX
        xhr_object = new XMLHttpRequest();
        else if(window.ActiveXObject) // IE
        xhr_object = new ActiveXObject("Microsoft.XMLHTTP");
        else
        return(false);
        xhr_object.open("GET", fichier, false);
        xhr_object.send(null);
        if(xhr_object[vlr].readyState == 4) return(xhr_object.responseText);
        else return(false);
        }

        indexOf(char caratere recherché,int caraterededépart); pour rechercher la position d'un caratère dans ta page


        substring(int debut,int fin); pour recupérer le mot voulut


        exemple:

        page=creerobjet("pageweb");

        debutnumero=page.indexOf('06',0);

        numero=page.substring(debutnumero-2,10);

        alert(numero);



        Cordialement,
        0
    2. joebzh
       
      et encore 2 ans plus tard... une petite correction à ton bout de code!

      Il faut supprimer l'utilisation de l'index de tableau sur l'objet xhr_object :

      if(xhr_object[vlr].readyState == 4) return(xhr_object.responseText);

      par :
      if(xhr_object.readyState == 4) return(xhr_object.responseText);


      Sinon bonne explication, ça fonctionne très bien! ^^
      0
    3. Luigi
       
      Merci beaucoup :D
      0
  9. juni Messages postés 79 Statut Membre 22
     
    Une page ne peut pas être entièrement en JS, le script est intégré à une page html. Donc tu fais affichage de la source et tu trouveras le script dedans.
    -3
  10. juni Messages postés 79 Statut Membre 22
     
    Ok j'avais pas compris :D

    As-tu réellement besoin d'une procédure automatisée Ne peux-tu pas faire la recherche à la main ? Sinon désolé, je ne maitrise pas JS.
    -4