>>> u = urllib.urlopen(" http://www.microsoft.com/index.html") >>> print u.headers
Connection: close
Date: Wed, 03 Apr 2002 14:05:19 GMT
Content-Type: text/html
Expires: Wed, 03 Apr 2002 14:05:19 GMT
Cache-Control: no-store, private
Server: Microsoft-IIS/5.0
P3P: CP='ALL IND DSP COR ADM CONo CUR CUSo IVAo IVDo PSA PSD TAI TELo OUR SAMo CNT COM INT NAV ONL PHY PRE PUR UNI'
Pragma: no-cache
Sans suprise : Microsoft utilise le serveur IIS 5, par contre c'est vilain de forcer les caches à ne pas stocker la page.
Par défaut, quand Python fait ses requêtes HTTP, il s'identifie auprès des serveurs web (comme tous les navigateurs):
"User-agent: Python-urllib/1.15".
Rien ne vous empêche d'utiliser un module plus bas niveau (HTTPLIB) pour mettre le User-agent qui vous intéresse et vous faire passer pour n'importe quel navigateur (y compris des navigateurs qui n'existent pas ;-)
Trouvez des réponses à vos questions sur la création de sites web, le référencement et les meilleures pratiques pour gérer un site. Échangez avec d'autres webmasters passionnés pour améliorer vos compétences en ligne et optimiser vos projets de site web.