Libreria urllib
1) Importar la librería urllib
import urllib
2) Abrir / Obtener la url de la página web
url = urllib.open('http://www.klinware.com')
3) Sacar contenido de la página web
contents = url.readlines()
Si quisiera ver todo el contenido puedo poner
print(contents)
Si quisiera solo una línea
contents[1]
Si quisiera unas cuantas líneas
contents[1:10]
4) Una vez con esto puedo sacar la información de la cabecera
headerinfo = url.info()
date = headerinfo.getheader('date')
contenttype = headerinfor.getheader('content-type')
5) Para volcar el contenido a un fichero
urllib.urlretrieve('http://www.klinware.com', filename='urlcontent')
- urlcontent - Fichero con la web volcada