Escrapear todos los boletines #1

pandres · 2017-03-18T21:41:03Z

Escrapear todos los boletines y meterlos en la db.

Bonus points: script para que reciba lista de urls.

mgaitan · 2017-03-20T04:01:08Z

si bien no escrapea las urls, ya está el comando para importar el texto a la db

python manage.py importar_seccion <url_al_pdf>

acepta multiples urls

pdelboca · 2017-03-20T14:21:14Z

La idea es migrar a este repo parte de la funcionalidad que tenemos en el otro y quedarnos con un solo repo (este). Concretamente, tenemos que traer el script que saca todas las urls e integrarlo con el comando que importa el texto a la db.

Podemos crear un nuevo comando para obtener todas las urls, y luego pasarle esas urls a este comando para que importe todos los textos.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Escrapear todos los boletines #1

Escrapear todos los boletines #1

pandres commented Mar 18, 2017

mgaitan commented Mar 20, 2017

pdelboca commented Mar 20, 2017 •

edited

Loading

Escrapear todos los boletines #1

Escrapear todos los boletines #1

Comments

pandres commented Mar 18, 2017

mgaitan commented Mar 20, 2017

pdelboca commented Mar 20, 2017 • edited Loading

pdelboca commented Mar 20, 2017 •

edited

Loading