Skip to content

Latest commit

 

History

History
130 lines (103 loc) · 5.35 KB

README.md

File metadata and controls

130 lines (103 loc) · 5.35 KB

WEB SCRAPING

Taller de extracción automatizada de datos de páginas web

Web scraping es una técnica que emplea diferentes tecnologías para extraer datos o información de una página web. Se usa para recoger datos sin estructura y convertirlos en datos estructurados para posteriormente ser tratados en bases de datos u hojas de cálculo. El taller es una aproximación práctica al scraping con el objetivo de permitir a los asistentes el tratamiento de información útil para sus propios proyectos.

Ediciones realizadas

I Edición: 6-7 febrero 2018, organizado por Montera34 e Hirikilabs en Tabakalera (Donostia/San Sebastián)

II Edición: 11-12 de mayo de 2018, organizado por AEDI en WorkInCompany (Sevilla).

Preparación previa

Requerimientos
  • Tener python instalado
Recomendaciones
  • Tener instalado algún editor de código (como VSCode)

Los ejercicios están preparados para ejecutarse con Python3, pero con algunos cambios puede ejecutarse con Python2

Instalación en Windows

Instalar python
  • Descarga python pinchando aqui
  • Ejecuta el archivo descargado y sigue las instrucciones.
  • Si te da error, intenta seguir este tutorial
  • Confirmar tecleando en consola CMD:
    python -version
Instalar pip
  • Sigue estas instrucciones
  • Si te da error, intenta añadir al PATH la localización de pip. Prueba a meter el full path: C:\Python39\Scripts\pip
  • Confirmar tecleando en la consola de python:
    pip import

Windows Vista: Para que python funcione en Windows Vista tenemos que añadirlo al “path” de manera que al escribir “python” en la linea de comandos (CMD) lo reconozca. Añadir a PATH significa decirle al ordenador dónde tiene que buscar el progama python.

Instalar módulos python con pip
  • Teclear:
    pip install nombre_del_modulo
  • Si da error, tecleando
    C:\Python39\Scripts\pip install nombre_del_modulo

    Windows 10: para instalar un paquete, usar py -m pip install nombre_del_modulo

Instalación en Mac

Instalar python
  • Descarga python pinchando en este enlace
  • Ejecuta el archivo descargado y sigue las instrucciones.
Instalar módulos python con pip
  • Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, se puede user pip desde la línea de comandos del sistema operativo, no desde la consola de Python:
    pip install nombre-modulo

Instalación en Linux

Instalar python
  • Abre una terminal
  • Comprueba si ya tienes instalado python tecleando:
    python -version
  • Si no lo tienes instalado teclea:
    sudo apt-get install python
Instalar pip
  • Abre una terminal
  • Entra en la consola de python tecleando:
    python
  • Comprueba que tienes pip instalado:
    pip import
  • Si no lo tienes, ejecuta:
    sudo apt-get install python-pip

Recursos de interés