Segunda Meetup PyData Granada: «La explosiva pareja del análisis Big Data: PySpark en Databricks»

27 abril 2023 | 18:15 h

  • Escuela Técnica Superior de Ingenierías Informática y de Telecomunicación

Comparte

La Oficina de Software Libre, junto con NumFocus, la ETS de Ingenierías Informática y de Telecomunicación, Python España y aiImpulsa, colabora en la organización de la conferencia/taller de la comunidad PyData Granada: «La explosiva pareja del análisis Big Data: PySpark en Databricks», que será impartido por Eugenio Marinetto.

PyData es una comunidad diversa de personas interesadas en el uso y desarrollo de herramientas de análisis de datos con el objetivo de compartir ideas y aprender. Nos reunimos para discutir las mejores prácticas, nuevos enfoques y tecnologías emergentes para la gestión de datos, procesamiento, análisis y visualización. Utilizamos muchos lenguajes de programación, incluyendo (pero no limitado a) Python, Julia y R.

PROGRAMA

  • 18:15 – Apertura de puertas y networking
  • 18:20 – Breve presentación de PyData Granada
    • Noticias e información sobre la comunidad.
  • 18:30 – La explosiva pareja del análisis Big Data: PySpark en Databricks.

Todos conocemos las maravillas que pueden hacer los modelos de Machine Learning e Inteligencia Artificial por nosotros pero para poder entrenar estos gigantes de la tecnología es necesario el empleo de datos limpios para que las predicciones sean precisas. Cuantos más datos usemos, mejor será nuestro modelo pero ¿cómo preparar datos masivos de forma ágil, sostenible y sobre todo, mantenible?

Spark es un framework Open Source que nos permite realizar transformación y limpieza de datos masiva mediante la computación paralela en clúster de computadores. PySpark es su API para Python con la que podremos preparar nuestros pipelines de forma sencilla.

Databricks es un servicio cloud que nos ofrece la gestión de nuestros clústers en el cloud así como la automatización de nuestros pipelines una vez estén preparados para ejecutarse. Junto con PySpark hacen una pareja de herramientas indispensable en el mundo del Big Data y de la Inteligencia Artificial.

En este workshop veremos:

    • Paseo e introducción a Databricks
    • Levantar un cluster
      Ejecutar notebooks
    • Introducción a Spark en Python
    • Cómo funciona Spark y su ejecución en paralelo
      Cómo crear un pipeline Big Data
      Optimización de queries y ejecución
    • Pipeline a producción
    • Tracking y mantenimiento
    • Introducción al Streaming de datos

IMPORTANTE >> Para el correcto desarrollo del taller, las personas participantes han de traer sus portátiles.

  • 20:00 – Picoteo y networking

  • Fecha: Jueves 27 de Abril de 2023
  • Lugar: ETS de Ingenierías Informática y de Telecomunicación
  • Horario: 18:15 – 20:00 h
  • Organiza: Oficina de Software libre, junto con NumFocus, la ETS Ingenierías Informática y de Telecomunicación, Python España y aiImpulsa.
  • Más información: Enlace al evento en la web OSL
Fechas y horarios
27 abril 2023 | 18:15 h
  • Escuela Técnica Superior de Ingenierías Informática y de Telecomunicación
C/ Periodista Daniel Saucedo Aranda, s/n
Canal UGR
Resumen de privacidad

La presente política de cookies tiene por finalidad informarle de manera clara y precisa sobre las cookies que se utilizan en la página web de la Universidad de Granada.

¿Qué son las cookies?

Una cookie es un pequeño fragmento de texto que los sitios web que visita envían al navegador y que permite que el sitio web recuerde información sobre su visita, como su idioma preferido y otras opciones, con el fin de facilitar su próxima visita y hacer que el sitio le resulte más útil. Las cookies desempeñan un papel muy importante y contribuyen a tener una mejor experiencia de navegación para el usuario.

Tipos de cookies

Según quién sea la entidad que gestione el dominio desde dónde se envían las cookies y se traten los datos que se obtengan, se pueden distinguir dos tipos: cookies propias y cookies de terceros.

Existe también una segunda clasificación según el plazo de tiempo que permanecen almacenadas en el navegador del cliente, pudiendo tratarse de cookies de sesión o cookies persistentes.

Por último, existe otra clasificación con cinco tipos de cookies según la finalidad para la que se traten los datos obtenidos: cookies técnicas, cookies de personalización, cookies de análisis, cookies publicitarias y cookies de publicidad comportamental.

Para más información a este respecto puede consultar la Guía sobre el uso de las cookies de la Agencia Española de Protección de Datos.

Cookies utilizadas en la web

A continuación se identifican las cookies que están siendo utilizadas en este portal así como su tipología y función.

La página web de la Universidad de Granada utiliza Google Analytics, un servicio de analítica web desarrollada por Google, que permite la medición y análisis de la navegación en las páginas web. En su navegador podrá observar cookies de este servicio. Según la tipología anterior se trata de cookies propias, de sesión y de análisis.

A través de la analítica web se obtiene información relativa al número de usuarios que acceden a la web, el número de páginas vistas, la frecuencia y repetición de las visitas, su duración, el navegador utilizado, el operador que presta el servicio, el idioma, el terminal que utiliza y la ciudad a la que está asignada su dirección IP. Información que posibilita un mejor y más apropiado servicio por parte de este portal.

Para garantizar el anonimato, Google convertirá su información en anónima truncando la dirección IP antes de almacenarla, de forma que Google Analytics no se usa para localizar o recabar información personal identificable de los visitantes del sitio. Google solo podrá enviar la información recabada por Google Analytics a terceros cuanto esté legalmente obligado a ello. Con arreglo a las condiciones de prestación del servicio de Google Analytics, Google no asociará su dirección IP a ningún otro dato conservado por Google.

Por último, se descarga una cookie denominada cookie_agreed, propia, de tipo técnico y de sesión. Gestiona el consentimiento del usuario para el uso de las cookies en la página web. El objetivo es recordar aquellos usuarios que las han aceptado y aquellos que no, de modo que a los primeros no se les muestre información en la parte inferior de la página al respecto.

Cómo modificar la configuración de las cookies

Usted puede restringir, bloquear o borrar las cookies de la Universidad de Granada o cualquier otra página web, utilizando su navegador. En cada navegador la operativa es diferente, la función de 'Ayuda" le mostrará cómo hacerlo.