Problème avec WebCopier

naima -  
 Utilisateur anonyme -
Bonjour,

j'utilise l'aspirateur webCopier version 4 démo, j'ai eu un problème lors du téléchargement d'un cours
voici le message dans le rapport:

Le téléchargement a démarré (11:12:36, Mai 5, 2008)

Erreur (n° -3) - 'http://www.go.out'

Le téléchargement est terminé (11:12:38, Mai 5, 2008)

Résumé :
Nbre de fichiers : 0 Taille totale : 0 octets

je ne sias pas c'est quoi le problème!!
merci
Configuration: Windows XP
mozilla firefox

15 réponses

  1. naima
     
    en fin quelque chose comme ... verifier que le site existe toujour..........verifier le proxy

    et voila ce qui est écrit dans le journal

    TTrack3.41-2+htsswf+htsjava launched on Mon, 05 May 2008 14:01:24 at https://openclassrooms.com/fr/courses +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
    (winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2007], %s -->" -P web: -%l "fr, en, *" https://openclassrooms.com/fr/courses -O1 "C:\Mes Sites Web\cours" +*.png +*.gif +*.jpg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar )
    Information, Warnings and Errors reported for this mirror:
    note: the hts-log.txt file, and hts-cache folder, may contain sensitive information,
    such as username/password authentication for websites mirrored in this project
    do not share these files/folders if you want these information to remain private
    14:01:24 Warning: Cache: damaged cache, trying to repair
    14:01:24 Warning: Cache: 0 bytes successfully recovered in 0 entries
    14:01:24 Warning: Cache: error trying to open the cache
    14:01:25 Warning: link is probably looping, type unknown, aborting: www.siteduzero.com/tuto-3-4-0-un-site-dynamique-avec-php.html
    14:01:25 Info: No data seems to have been transfered during this session! : restoring previous one!
    2
  2. Utilisateur anonyme
     
    Salut c'est un peu vieux mais j'ai une solution pour HTTrack,

    Bon voila à quoi ressemble le robot anti-aspirateur

    # Robots known or highly suspected of collecting email addresses for spam
    RewriteCond %{HTTP_USER_AGENT} ^(autoemailspider|Bullseye|CherryPicker|Crescent|ecollector|EmailCollector|EmailSiphon|EmailWolf|ExtractorPro|fastlwspider|.*LWP|Digger|Microsoft.URL|Mozilla/3.Mozilla/2.01|Mozilla.*NEWT|NICErsPRO|SurfWalker|Telesoft|WebBandit|WebEMailExtrac|Zeus.*Webster) [NC,OR]
    
    # Robots (sometimes called spiders) which regularly violate robots.txt
    RewriteCond %{HTTP_USER_AGENT} ^(ADSARobot|.*almaden\.ibm|ASSORT|big.brother|bumblebee|Digimarc|FavOrg|FAST|.*fluffy|.*Girafabot|HomePageSearch|IncyWincy|NPBot|Openfind|OpenTextSiteCrawler|OrangeBot|Robozilla|ScoutAbout|.*searchhippo|searchterms\.it|sitecheck|UIowaCrawler|.*webcraft@bea\.com|WEBMASTERS|WhosTalking|WISEbot|Yandex) [NC,OR]
    
    # Agents used for both good and bad purposes, such as sucking up bandwidth
    # by downloading entire sites, or probing servers for security exploits.
    RewriteCond %{HTTP_USER_AGENT} ^(ASPSeek|Deweb|Fetch|FlashGet|Teleport|TeleportPro|Getleft|GetURL|GetWebPage|.*HTTrack|KWebGet|libwww-perl|Mirror|NetAnts|NetCarta|netprospector|Net.Vampire|pavuk|PSurf|PushSite|reget|Rsync|Shai|SpiderBot|SuperBot|tarspider|Templeton|w3mir|web.by.mail|WebCopier|WebCopy|WebMiner|WebReaper|WebSnake|WebStripper|webvac|webwalk|WebZIP|Wget|XGET) [NC,OR]
    
    # Miscellaneous (suspicious -- more information would be appreciated)
    RewriteCond %{HTTP_USER_AGENT} ^(ah-ha|aktuelles|ATHENS|attache|bew|disco|.*DTS.Agent|Favorites.Sweeper|FEZhead|GetRight|go-ahead-got-it|.*Harvest|IBM_Planetwide|leech|MCspider|NetResearchServer|nost\.info|OpaL|PackRat|RepoMonkey|.*Rover|Spegla|SqWorm|.*TrueRobot|UtilMind|vspider|.*WUMPUS) [NC,OR]
    
    
    # A host which tries to hide itself in reverse DNS lookup
    RewriteCond %{REMOTE_HOST} ^private$                               [NC,OR]
    
    # Web surveying sites (may require using ipchains)
    RewriteCond %{HTTP_REFERER} (traffixer|netfactual|netcraft)\.com   [NC,OR]
    RewriteCond %{REMOTE_HOST} \.netcraft\.com$                        [NC,OR]
    
    # A fake referrer that's often used -- use this unless your pages are related
    # in some way to atomic energy and could really be linked to from www.iaea.org
    RewriteCond %{HTTP_REFERER} ^[^?]*iaea\.org                        [NC,OR]
    
    # A fake referrer that's used in conjuncting with formmail exploits
    RewriteCond %{HTTP_REFERER} ^[^?]*\.ideography\.co\.uk             [NC]
    
    # The rule which blocks out further access from the host
    RewriteRule .* - [F,L]
    
    


    Il détecte l'identifiant du navigateur et par foi l'en-tête HTML, alors il suffi d'aller dans "définitoire les options" -> l'onglet "Navigateur Internet" et de mettre n'importe quoi genre :

    Mozilla/10.08 [fr] (Win7; I)
    et
    <!-- Yohoow Yataaa \0/  -->
    


    Ps: j'ai la version WinHTTrack Website Copier 3.43-9
    1
  3. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    C'est simple: www.go.out n'existe pas.
    0
    1. naima
       
      slt,
      mais c 'est pas moi qui a entrer cette url : www.go.out (je sais quelle na aucun sens)
      j'ai entrer celle du cours que je voulais télécharger.
      est ce qu'il na pas pu se connecter au serveur concerné ou j'ai un broblème avec la configuration de webcopier?
      merci j'attend votre réponse
      0
  4. Vous n’avez pas trouvé la réponse que vous recherchez ?

    Posez votre question
  5. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    C'est quelle URL que tu as essayé de mettre ?
    Et est-ce que webcopier a affiché des erreurs ?
    0
    1. naima
       
      resalut,
      j'ai entré cette url: https://openclassrooms.com/fr/courses

      merci
      nom il ma rien affiché, je lance le téléchargement après avoir entrer le nom du projet et l'enregistrer
      0
  6. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Je ne connais pas webcopier, mais s'il t'a affiché: http://www.go.out au lieu de http://www.siteduzero.com... c'est que tu as mal entré l'adresse.

    En plus du nom du projet, il faut entrer l'adresse à récupérer quelquepart.
    0
    1. naima
       
      resalut,
      non il accèpte l'url que j'entre, il commence le téléchargement et le termine.mais quant j'essaye d'ouvrire le dossier du site téléchargé je le trouve vide, en cliquant sur l'onglet rapport dans l'interface de webcopier je trouve le message dont je vous parler
      0
      1. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684 > naima
         
        Je ne connais pas webcopier, je ne pourrai donc pas te guider dans son utilisation, désolé.
        (J'utilise HTTrack)
        0
      2. naima > sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention  
         
        rsalut sebsauvage,
        j'ai téléchargé httrack, mais j'ai pas su le bien configurer, il n'arrive pas à télécharger et m'affiche un message d'errur
        merci bien de votre compréhension.
        0
  7. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Il affiche quoi comme message d'erreur ?
    0
  8. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Je ne vois pas. Il semble que ça soit un bug de la nouvelle version de httrack.

    Bon, en dernier recours, je suggère Firefox + ScrapBook, en lui demandant de prendre uniquement un seul niveau de profondeur.

    https://imageshack.com/
    https://imageshack.com/
    0
    1. naima
       
      j'ai téléchargé la version : HTTrack 3.41-2
      c'est la même que vous utilisé ?
      0
  9. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    J'ai une ancienne version.

    Essaie avec ScrapBook: Il est plus lent que httrack, mais il marche bien chez moi.
    0
    1. naima
       
      j'ai téléchargé scrapbook mais j'ai pas pu l'installer c'est un fichier compressé et en l'ouvrant avec winrar je trouve pas le fichier éxécutable pour l'installer!
      0
      1. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684 > naima
         
        ScrapBook ne fonctionne que dans Firefox.
        Installe Firefox (en prime, c'est un bien meilleur navigateur qu'Internet Explorer).
        0
  10. naima
     
    bonjour a tous,
    qui peut m'aider à configurer webcopier prceque j'ai eu un problème lors de son utilisation
    lorsequ'il termine le téléchargement il m'affiche un message d'errur pour soit verifier l'éxistance du site soit verifier la configuration du proxy
    merci
    0
  11. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Avec webcopier, essaie de récupérer juste une page: https://sebsauvage.net/
    (c'est un simple fichier html statique).

    dis-nous déjà si ça fonctionne.
    0
  12. naima
     
    resalut sébastien,

    avec ton site ça fonctionne très bien il est entrain de télécharger pou le moment
    donc ce webcopier il ne peut pas télécharger tous les site ou qoui???
    merci infiniment pour l'aide
    j'ai une chose à vous demandé, moi aussi je suis ingénieur en informatique option système d'information, j'aimerai bien vous contacter pour des sujets concernant : uml, mysql, sqlserver et d'autres
    donc si c'est possible de m'envoyé votre e-mail
    merci bien dans tous les cas..

    je doit partire, je consulte votre réponse demain matain et je te rendrai rép concernant webcopier parcequ'il est en cours de téléchargement.
    0
  13. sebsauvage Messages postés 33284 Date d'inscription   Statut Modérateur Dernière intervention   15 684
     
    Les logiciels de copie de site ne fonctionnent effectivement pas avec tous les sites.

    donc si c'est possible de m'envoyé votre e-mail

    Je n'aide pas par email. Je reçois trop de demandes.

    Tu es ici sur un forum avec plus de 30000 membres. Tu peux utiliser le moteur de recherche du site et poser tes questions.
    0
    1. naima
       
      bonjour,

      merci pour votre réponse.

      Je vous ai envoyé un e-mail de ma boîte sur : sebsauvage@sebsauvage.net
      merci une autre fois.
      0
    2. naima
       
      bonjour,
      webcopier à pu aspirer votre site ( que je trouve vraiment formidable et très intéressent. merci .....)
      mais il na rien fait avec le site: siteduzero dont je voulais aspirer le cours PHP

      Je vais continuer ma recherche jusqu'à ce que je trouve un aspirateur pour mon cours PHP..

      MERCI.
      0
  14. jihelge
     
    En fait www.go.out est un re-routage effectué par un robot que l'on voit s'enclancher au début de l'auscultation de siteduzero.com

    C'est un anti aspirateur qui route vers ce www.go.out qui fait mettre à genou les aspirateur quels que soit leur type ou génération

    Le complications arrive avec www.go.out/robot.txt puis il essai de remonter mais se casse la figure. J'ai essayé de mettre dans les options des conditions de fltrage mais sans succès. Je vais faire un essai avec téléport pro
    0