Réalisation d'un outils SEO
                    
        
     
             
                    Kalheesi
    
        
    
                    Messages postés
            
                
     
             
            11
        
            
                                    Statut
            Membre
                    
                -
                                     
Kalheesi Messages postés 11 Statut Membre -
        Kalheesi Messages postés 11 Statut Membre -
        Bonjour,
Je suis actuellement en stage en entreprise et mon projet est de réaliser un outils de type SEO (récupération de donnée tel que le nombre de phrase, de mot, de lien, ect. sur la page web analyser). Je viens vous demander de l'aide car après de nombreuses recherches je ne trouve pas les informations voulus..
J'ai pris connaissance de la fonction file_get_contents() qui me permet de récupérer la page en code html (si j'ai bien compris), cependant y a-t-il une méthode pour distinguer les images, les textes, ect. de ce code ?
Ce qui va me poser plus de réflexion je pense est de savoir comment récupérer les pages indexés et le poids de la page.
Je vous avoue que je ne sais pas trop par quoi commencer, et je me sens complètement perdue. Je vous ne vous demande pas non plus de me servir le code php de mon outil sur un plateau mais de me donner quelques pistes. :)
Merci de votre aide.
                
            
                
    
    
    
        Je suis actuellement en stage en entreprise et mon projet est de réaliser un outils de type SEO (récupération de donnée tel que le nombre de phrase, de mot, de lien, ect. sur la page web analyser). Je viens vous demander de l'aide car après de nombreuses recherches je ne trouve pas les informations voulus..
J'ai pris connaissance de la fonction file_get_contents() qui me permet de récupérer la page en code html (si j'ai bien compris), cependant y a-t-il une méthode pour distinguer les images, les textes, ect. de ce code ?
Ce qui va me poser plus de réflexion je pense est de savoir comment récupérer les pages indexés et le poids de la page.
Je vous avoue que je ne sais pas trop par quoi commencer, et je me sens complètement perdue. Je vous ne vous demande pas non plus de me servir le code php de mon outil sur un plateau mais de me donner quelques pistes. :)
Merci de votre aide.
        A voir également:         
- Réalisation d'un outils SEO
- Barre d'outils windows 10 - Guide
- Seo spyglass - Télécharger - Divers Web & Internet
- Télécharger la barre d'outils google - Télécharger - Navigateurs
- Outils benchmark site web - Accueil - Utilitaires
- Seo tools - Télécharger - Référencement & SEO
2 réponses
                        
                    Bonjour, 
Pour trouver toutes les balises, le plus simples c'est de parser ton ficher comme tu le ferai avec un fichier XML
https://www.php.net/manual/fr/domdocument.loadhtml.php
Tu pourra ainsi avec une fonction recursive parser toute ta page, avoir le nom des balises, etc ...
Et ainsi différencier le traitement si c'est une image, un lien, ou du texte.
    
                Pour trouver toutes les balises, le plus simples c'est de parser ton ficher comme tu le ferai avec un fichier XML
https://www.php.net/manual/fr/domdocument.loadhtml.php
Tu pourra ainsi avec une fonction recursive parser toute ta page, avoir le nom des balises, etc ...
Et ainsi différencier le traitement si c'est une image, un lien, ou du texte.
                        
                    Merci pour ton aide.
Au final l'entreprise où je suis utilise la classe Snoopy, donc j'ai réussi à me débrouiller sans parser.
(pour ceux que ça interesse : http://snoopy.sourceforge.net/
    
                Au final l'entreprise où je suis utilise la classe Snoopy, donc j'ai réussi à me débrouiller sans parser.
(pour ceux que ça interesse : http://snoopy.sourceforge.net/
