Récuperez texte d'une page web

Fermé
Rky - 4 août 2015 à 18:43
 Rky - 5 août 2015 à 15:55
Bonjour,

Je souhaiterai récuperer le texte de cette page : http://www.flashresultats.fr/

J'ai essayé d'utiliser Jsoup ou autre mais tout ce que je récupère c'est le code de cette page. Auriez vous une solution simple pour résoudre mon problème ?

Merci
A voir également:

1 réponse

nichola Messages postés 111 Date d'inscription jeudi 7 juin 2007 Statut Membre Dernière intervention 24 avril 2016 11
Modifié par nichola le 4/08/2015 à 19:33
Salut,

J'ai déjà utilisé JSoup plusieurs fois sans problème, connais pas mieux en Java pour ce genre de chose. Tu obtiens quoi comme résultat ? Le souci çà peut éventuellement être que la page est générée par requêtes Ajax et donc javascript ... que Jsoup ne gère pas ...
0
Ah mince je crois que c'est du javascript derière :

<script type="text/javascript">
//
try {
matches = /^([^#]+)#(.*)\breload:([0-9]+)\-([0-9])(.*)$/.exec(parent.location.href);
} catch (e) {}

.....


</script>

Y'a-t-il une methode pour récupérer le texte qui s'affiche sur le site ?

Merci
0
nichola Messages postés 111 Date d'inscription jeudi 7 juin 2007 Statut Membre Dernière intervention 24 avril 2016 11
5 août 2015 à 14:40
La seule méthode que je connaisse et qui fonctionne bien pour ce genre de cas c'est d'utiliser un outil comme https://phantomjs.org/ qui va évaluer la page comme un vrai navigateur et ensuite tu peux utiliser des selecteurs css pour récupérer tes infos comme avec Jsoup.

En Java il y à HtmlUnit qui utilise Rhino comme moteur Javascript mais c'est franchement pas extra ...
0
Je vais essayer de me pencher sur ca, merci ;)
0