Scrapy, ¡hazte con todos (los datos)!

-
Tags: #scrapy #talleres

¡¡Hola, PyLadies!!

Después de practicar con las katas tenemos energía más que suficiente para nuestro siguiente meetup. Un taller para aprender a hacer web scraping utilizando Scrapy, uno de los frameworks más populares para la construcción de spiders.

Actualmente con el auge del data science, es común el capturar datos para el posterior entrenamiento de modelos. Por ello, en este taller usaremos los datos de unas criaturas famosas por capturarse y entrenarse, Pokémon.

Trataremos las situaciones más comunes que pueden darse en un proyecto de captura de datos, construiremos una base de datos con un modelo ajustado a las características de los datos y finalmente plantearemos posibles usos para nuestra nueva base de datos. Así que ya sabes entrenador, pon a punto tu ordenador ¡Y que comience la captura!

Nuestra entrenadora

  • Irene Fernández será nuestra entrenadora Pokémon. Es ingeniera del software y una apasionada de la programación, los videojuegos y las cosas monas. Actualmente trabaja como ingeniera de crawling en TrustYou, recogiendo datos de hoteles y restaurantes con distintas herramientas de scraping en Python.

Además contaremos con la ayuda de súper expertas en Python, profesionales que lo usan en su día a día, que harán de mentoras para guiarnos y resolver dudas (avísanos si quieres ser mentora).

Dónde

No podríamos contar con mejor sitio para crear spiders y cazar Pokémos que en las oficinas de ZOOPLUS. En la calle Génova 17, 1ª Planta.

Desayuno comunitario

Esto no solo va de programar, sino también de empezar el día con energía con un buen desayuno comunitario. ¿Esto cómo funciona? Fácil: las coordinadoras llevarán todo lo necesario para hacer café/té, pero la comida la aportaremos entre todas.

Para que esta vez esté más organizado hemos creado un documento (https://docs.google.com/spreadsheets/d/12xEar-TJ945epSMwJt3NGpWB6ikcmkrK30thK31if4A/edit?usp=sharing) para ir apuntando qué cosas va a traer cada una. De esta forma podremos evitar que sobre comida y podremos saber qué cosas pueden faltar. Así podremos darnos un festín mientras programamos juntas :)

¡Y recuerda!: para que el evento sea lo más sostenible posible, no vamos a llevar vasos desechables. Tráete tu vaso de bambú de la fiesta del otro día, o cualquier termo o taza que tengas en casa para tomarte ahí la bebida.

Para quién está enfocado

En resumen: todos los niveles que quieran aprender scrapy.

Tanto si acabas de aprender a programar en Python, como si llevas años usándolo, ¡este meetup es para ti! Solo necesitarás ganas de aprender a scrapear webs.

Qué tienes que hacer tú

Recapitulando, lo que tienes que hacer es: - Lo primero, y más importante, traer tu portátil. - Traer de casa tu vaso/termo/taza para la bebida. - Traer algo de comida para aportar al desayuno comunitario y apuntarlo en el documento. - Si finalmente no puedes asistir, liberar tu plaza cuanto antes para que otra persona pueda aprovecharla. - Venir con la energía a tope para una mañana pythónica!

Material del taller

Puedes encontrar el material de este taller en el siguiente repo de GitHub