Libreria urllib

1) Importar la librería urllib

import urllib

2) Abrir / Obtener la url de la página web

url =  urllib.open('http://www.klinware.com')

3) Sacar contenido de la página web

contents = url.readlines()
  • Si quisiera ver todo el contenido puedo poner print(contents)

  • Si quisiera solo una línea contents[1]

  • Si quisiera unas cuantas líneas contents[1:10]

4) Una vez con esto puedo sacar la información de la cabecera

headerinfo = url.info()
date = headerinfo.getheader('date')
contenttype = headerinfor.getheader('content-type')

5) Para volcar el contenido a un fichero

urllib.urlretrieve('http://www.klinware.com', filename='urlcontent')
  • urlcontent - Fichero con la web volcada

results matching ""

    No results matching ""