Analyse de pages Web

Signaler
-
Bonjour,

Je fais de la généalogie et j'ai publié des milliers d'actes sur le site Geneanet.
Je souhaiterais récupérer la liste de ces actes afin de vérifier leur cohérence par rapport à ma propre base.
Pour cela j'ai écrit un script en Perl, mais je n'obtiens pas le résultat attendu.

Voici mon script:

#!/usr/bin/perl -w
    use strict;
    use LWP::UserAgent;
    use HTML::Form;

    # les paramètres personnels
    my ( $user, $pass ) = qw( monuser monpwd );
    my $url = 'http://www.geneanet.org/connexion/';
    # my $url = 'https://www.geneanet.org/archives/actes/gestion/?p=1';

    # initialisation de l'agent
    my $ua = LWP::UserAgent->new;
    $ua->agent("Mozilla/8.0"); # pretend we are very capable browser

    # création de la requête

    my $req = HTTP::Request->new( GET => $url);
    $req->header('Accept' => 'text/html');

    # exécute la requête et reçoit la réponse
    my $res = $ua->request($req);
    print "\nKO\n" if not $res->is_success;

    # le formulaire de login est le second formulaire de la page
    my $form = ( HTML::Form->parse( $res->decoded_content, $url ) )[1];


    # remplit les champs
    $form->find_input('_username')->value($user);
    $form->find_input('_password')->value($pass);

    # valide et renvoie le formulaire
    $ua->request( $form->click );
        $ua->request( $form->click );
    
    # demande l'affichage de la page 2      
    $url = 'https://www.geneanet.org/archives/actes/gestion/?p=2';
    $req = HTTP::Request->new( GET => $url);
    $req->header('Accept' => 'text/html');
    $res = $ua->request($req);
    print "\nKO\n" if not $res->is_success;
    print $res->decoded_content; 



L'affichage de la page 2 devrait me retourner l'équivalent de ceci:

BARROIS Adéline Stéphanie 06/02/1853 Merville, Nord, Nord-Pas-de-Calais, France

L'idée est ensuite de faire une boucle (de près de 1000 pages) pour récupérer l'ensemble des données et faire mes vérifications.

Quelqu'un peut-il m'aider?

D'avance, merci.

Configuration: Windows / Chrome 87.0.4280.88