Repositorio construido para almacenar los recursos compartidos por Factored durante el training octubre 2021 (#DataChallenge365FEM 2020-2021).
Darte una guía de como sería un desarrollo básico de un modelo de machine learning.
Desde IMPORTAR y ANALIZAR datos; DESARROLLAR y EVALUAR MODELOS predictivos; HASTA realizar el DEPLOYMENT DE una API usando FastAPI
y Docker
.
- Link del gitbook del training
- Link del video del training
- Link de la data del training "New York City Taxi Trip Duration"
- Comandos basicos de Docker
Recurso :
Temario:
Gráficas y Storytelling 💬
Flujo de trabajo colaborativo en GitHub 🐱🐙
- Crear un repositorio
- Cómo crear una rama
- Hacer y registrar cambios
- Cómo crear un Pull Request
Importación y Manejo de datos con pandas.
- Carga de datasets desde un `bucket de S3 (AWS)`
- Procesamiento con pandas
Visualizar datos con `matplotlib` y `seaborn`.🤓 🔍
- Diferentes tipos de gráficos.
- Cómo manejar formatos de gráficas con axes y figures.
Recurso :
Temario:
Flujos de preprocesamiento en `scikit-learn`:
- Cómo escribir transformaciones personalizadas.
- Cómo aplicar transformaciones de datos a ciertas variables con `ColumnTransformer`.
- Cómo usar `Pipeline` y `FeatureUnion` para unir diferentes transformaciones.
MLflow con modelos de scikit-learn:
- Cómo usar la API de scikit-learn para entrenar modelos.
- Cómo usar `MLflow` para guardar experimentos con modelos de scikit-learn.
Recurso :
Temario:
Escribir una `API` de un modelo usando `FastAPI`.
- Generación de endpoints.
- Correr aplicación localmente y probar con datos de entrada.
Construir un contenedor de Docker para desplegar API.
- Cómo escribir un `Dockerfile`.
- Cómo crear y correr `Docker containers`.