Este repositorio contiene las tareas, proyectos y exámenes realizados durante el programa de Data Science y Machine Learning en Coding Dojo. Cada carpeta está organizada por módulos y áreas de aprendizaje, abarcando desde fundamentos de ciencia de datos hasta modelos avanzados de machine learning.
Directory structure:
└── gillopy-Coding_Dojo_DS_ML/
├── README.md
├── LICENSE
├── 1 - DataScience_Fundamentals/
│ ├── 1 - Python para Ciencia de Datos/
│ │ ├── 1 - Manejo de cadenas (Core)/
│ │ │ ├── README.md
│ │ │ └── Tarea Cadenas.ipynb
│ │ ├── 2 - Sistema de Calificaciones (Core)/
│ │ │ ├── README.md
│ │ │ └── Sistema_calificaciones.ipynb
│ │ ├── 3 - Análisis de Datos con NumPy (Core)/
│ │ │ ├── README.md
│ │ │ └── Analisis_de_datos_numpy.ipynb
│ │ └── 4 - Proyecto I- Análisis y predicción de ventas-Part 1 (Core)/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ ├── Limpieza.ipynb
│ │ │ └── limpiezanumpy.ipynb
│ │ └── data/
│ │ └── retail_sales_dataset.csv
│ ├── 2 - Pandas para Ciencia de Datos/
│ │ ├── 1 - Analisis de datos con Pandas (Core)/
│ │ │ ├── README.md
│ │ │ ├── VideoGamesSale.ipynb
│ │ │ └── data/
│ │ │ └── vgsales.csv
│ │ └── 2 - Proyecto I- Parte II (Core)/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ └── Limpieza.ipynb
│ │ └── data/
│ │ └── retail_sales_dataset.csv
│ ├── 3 - Pandas y Visuazualizacion/
│ │ ├── 1 - Analisis con Pandas (Core)/
│ │ │ ├── README.md
│ │ │ ├── Data/
│ │ │ │ └── EconomicData.csv
│ │ │ └── Notebooks/
│ │ │ └── Pandas para Ciencia de Datos II - Analisis con Pandas (Core).ipynb
│ │ ├── 2 - Proyecto I- Parte III (Core)/
│ │ │ ├── README.md
│ │ │ ├── Code/
│ │ │ │ ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
│ │ │ │ ├── Exploración y Visualización de Datos Avanzada.ipynb
│ │ │ │ └── Transformacion y Analisis.ipynb
│ │ │ └── data/
│ │ │ └── retail_sales_dataset.csv
│ │ └── 3 - Simulación del Examen (Core)/
│ │ ├── README.md
│ │ ├── Simulacion Examen.ipynb
│ │ └── user_app_data.csv
│ ├── 4 - Visualizacion Avanzada para Ciencia de Datos/
│ │ ├── 1 - Arreglar el gráfico (Core)/
│ │ │ ├── README.md
│ │ │ └── Core Arreglar el Grafico.ipynb
│ │ ├── 2 - Ejercicios de histogramas y boxplots (Core)/
│ │ │ ├── README.md
│ │ │ └── Ejercicios de histogramas y boxplots (Core).ipynb
│ │ ├── 3 - Proyecto I- Parte IV (Core)/
│ │ │ ├── README.md
│ │ │ ├── Code/
│ │ │ │ ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
│ │ │ │ └── Transformacion y Analisis.ipynb
│ │ │ └── data/
│ │ │ └── retail_sales_dataset.csv
│ │ ├── 4 - Recreando gráfico (Core)/
│ │ │ ├── README.md
│ │ │ └── Recreando gráfico (Core).ipynb
│ │ └── 5 - Proyecto 1-Parte V (Core)/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
│ │ │ ├── Exploración y Visualización de Datos Avanzada.ipynb
│ │ │ └── Transformacion y Analisis.ipynb
│ │ └── data/
│ │ └── retail_sales_dataset.csv
│ └── Examenes/
│ ├── Examen de Certificación – Intento 1A/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ └── Examen.ipynb
│ │ └── Data/
│ │ └── vgchartz-2024.csv
│ ├── Examen de Certificación – Intento 2/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ └── Examen 2.ipynb
│ │ └── Data/
│ │ └── hotel_bookings.csv
│ └── Examen de Certificación – Intento 3/
│ ├── README.md
│ ├── Code/
│ │ └── Examen 3.ipynb
│ └── Data/
│ └── Telecom.csv
├── 2 - Machine_Learning/
│ ├── 1 - Modelos de Regresion/
│ │ ├── 1.1 - Regresión - Regresión 1 (Core)/
│ │ │ ├── README.md
│ │ │ ├── Code/
│ │ │ │ └── Ejercicio de Regresión 1 (Core).ipynb
│ │ │ └── Data/
│ │ │ └── house_prices.csv
│ │ ├── 1.2 - Árbol - Precios de Autos (Core)/
│ │ │ ├── README.md
│ │ │ ├── Code/
│ │ │ │ ├── Predicción de Precios de Autos (Core).ipynb
│ │ │ │ └── utils.py
│ │ │ └── Data/
│ │ │ └── Automobile_data.csv
│ │ └── 1.3- Árbol - Precios de Vehículos Usados (Core)/
│ │ ├── README.md
│ │ ├── Precios de Vehículos Usados (Core).ipynb
│ │ └── utils.py
│ ├── 2 - Modelos de Clasificacion/
│ │ ├── 2.1 - Clasificación basada en arboles - Proyecto 1- Parte final (Core)/
│ │ │ ├── README.md
│ │ │ ├── data/
│ │ │ │ └── retail_sales_dataset.csv
│ │ │ ├── notebooks/
│ │ │ │ ├── Proyecto 1- Parte final (Core).ipynb
│ │ │ │ └── utils.py
│ │ │ └── reports/
│ │ │ ├── model_performance_detailed_report.txt
│ │ │ └── model_performance_report.txt
│ │ ├── 2.2- Clasificación básica - Predicción de Calidad del Vino (Core)/
│ │ │ ├── Readme.md
│ │ │ ├── Code/
│ │ │ │ ├── 4 - Clasificación básica Predicción de Calidad del Vino (Core) copy.ipynb
│ │ │ │ └── utils.py
│ │ │ ├── Data/
│ │ │ │ └── WineQT.csv
│ │ │ └── PDF/
│ │ ├── 2.3 - Clasificación basada en arboles - Proyecto 2-Parte I (Core)/
│ │ │ ├── README.md
│ │ │ ├── EDA/
│ │ │ │ ├── 1- EDA cancer.ipynb
│ │ │ │ ├── 2- EDA gym.ipynb
│ │ │ │ ├── 3- EDA heart.ipynb
│ │ │ │ ├── 4- EDA behavior.ipynb
│ │ │ │ └── utils.py
│ │ │ ├── datasets/
│ │ │ │ ├── 1-cancer.csv
│ │ │ │ ├── 2-gym_members_exercise_tracking.csv
│ │ │ │ ├── 3-heart.csv
│ │ │ │ └── 4-user_behavior_dataset.csv
│ │ │ └── selected_dataset/
│ │ │ ├── EDA heart.ipynb
│ │ │ ├── heart.csv
│ │ │ └── utils.py
│ │ ├── 2.4 - Clasificación y Optimización de Hiperparámetros (Core)/
│ │ │ ├── README.md
│ │ │ ├── 11 - Clasificación y Optimización de Hiperparámetros (Core).ipynb
│ │ │ └── utils.py
│ │ └── 2.5 - Optimización - Proyecto 2-Parte II (Core)/
│ │ ├── README.md
│ │ ├── Proyecto 2-Parte 2 (Core).ipynb
│ │ ├── heart.csv
│ │ └── utils.py
│ ├── 3 - Boosting/
│ │ ├── 3.1 - LGBM - Clasificación utilizando LightGBM (Core)/
│ │ │ ├── README.md
│ │ │ ├── code/
│ │ │ │ ├── Clasificación utilizando LightGBM (Core).ipynb
│ │ │ │ └── utils.py
│ │ │ └── data/
│ │ │ └── loan.csv
│ │ ├── 3.2 - SVM - Challenge Técnico (Core)/
│ │ │ ├── README.md
│ │ │ ├── 6 - Challenge Tecnico (Core).ipynb
│ │ │ ├── submission.csv
│ │ │ ├── test.csv
│ │ │ ├── train.csv
│ │ │ └── utils.py
│ │ └── 3.3 - XGBOOST - Clasificación utilizando XGBoost (Core)/
│ │ ├── README.md
│ │ ├── Clasificación utilizando XGBoost (Core).ipynb
│ │ └── utils.py
│ └── Examenes/
│ ├── Examen de certificación – Intento 1/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ ├── Examen de certificación – Intento 1.ipynb
│ │ │ └── utils.py
│ │ └── Data/
│ │ └── HousePrices/
│ │ ├── data_description.txt
│ │ ├── sample_submission.csv
│ │ ├── test.csv
│ │ └── train.csv
│ ├── Examen de certificación – Intento 2/
│ │ ├── README.md
│ │ ├── Code/
│ │ │ ├── Examen de certificación – Intento 2.ipynb
│ │ │ └── utils.py
│ │ └── Data/
│ │ └── diabetes.csv
│ └── Examen de certificación – Intento 3/
│ ├── README.md
│ ├── Examen de certificación – Intento 3.ipynb
│ └── utils.py
└── 3 - Advance_Machine_Learning/
├── 1 - Aprendizaje no supervisado/
│ ├── 1.1 - Dimensionalidad - PCA (Core)/
│ │ ├── README.md
│ │ ├── Reducción de dimensionalidad - PCA (Core).ipynb
│ │ └── utils.py
│ ├── 1.2 - Reducción de dimensionalidad - PCA 2 (Core)/
│ │ ├── README.md
│ │ ├── Dimensionalidad - PCA 2 (Core).ipynb
│ │ └── utils.py
│ ├── 1.3 - Ingeniería de Características - Creación de Nuevas Variables (Core)/
│ │ ├── Creación de Nuevas Variables (Core).ipynb
│ │ └── utils.py
│ ├── 1.4 - Ingeniería de Características - Transformaciones de Variables (Core)/
│ │ ├── Transformaciones de Variables (Core).ipynb
│ │ ├── utils.py
│ │ └── datasets/
│ │ └── house-prices/
│ │ ├── data_description.txt
│ │ ├── house-prices-advanced-regression-techniques.zip
│ │ ├── sample_submission.csv
│ │ ├── test.csv
│ │ └── train.csv
│ ├── 1.5 - Clusterización - Algoritmo K-means (Core)/
│ │ ├── README.md
│ │ ├── 15 - Algoritmo K-means (Core).ipynb
│ │ └── utils.py
│ ├── 1.6 - Clusterización - Métricas de Agrupamiento (K-means y DBSCAN) (Core)/
│ │ ├── README.md
│ │ ├── Agrupamiento (K-means y DBSCAN) (Core).ipynb
│ │ └── utils.py
│ ├── 1.7 - Clusterización - DBSCAN (Core)/
│ │ ├── DBSCAN (Core).ipynb
│ │ └── utils.py
│ └── data/
│ ├── data/
│ │ └── titanic/
│ │ ├── gender_submission.csv
│ │ ├── test.csv
│ │ ├── titanic.zip
│ │ └── train.csv
│ └── titanic/
│ ├── gender_submission.csv
│ ├── test.csv
│ ├── titanic.zip
│ └── train.csv
├── 2 - Aprendizaje profundo/
│ ├── 1 - MLP Básica (Core)/
│ │ └── Aprendizaje profundo - MLP Básica (Core).ipynb
│ ├── 2 - MLP con Early Stopping y Dropout (Core)/
│ │ └── Aprendizaje profundo - MLP con Early Stopping y Dropout (Core).ipynb
│ ├── 3 - Reducción de Dimensionalidad y Benchmarking de Modelos (Core)/
│ │ ├── Reducción de Dimensionalidad y Benchmarking de Modelos (Core).ipynb
│ │ └── utils.py
│ └── 4 - Redes Neuronales Recurrentes y Prophet para Predicción de Series Temporales (Core)/
│ └── Redes Neuronales Recurrentes y Prophet.ipynb
└── Examenes/
├── Examen de certificación – Intento 1/
│ ├── README.md
│ └── Code/
│ ├── Examen de certificación – Intento 1.ipynb
│ ├── utils.py
│ └── Informe/
└── Examen de certificación – Intento 2/
├── README.md
├── Code/
│ ├── Examen de certificación – Intento 2.ipynb
│ └── utils.py
└── Informe/
- Manejo y análisis de datos: Ejercicios prácticos con Python y NumPy.
- Proyectos iniciales: Predicción de ventas.
- Visualización: Gráficos básicos y avanzados con Matplotlib y Seaborn.
- Modelos de regresión: Predicción de precios.
- Clasificación: Árboles de decisión y otros algoritmos.
- Análisis exploratorio: Datasets reales para predicciones y descripciones.
- Simulaciones: Pruebas de certificación.
- Proyectos integradores: Datasets variados (ventas, vino, etc.).
- Lenguajes: Python
- Bibliotecas: NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn
- Entorno: Jupyter Notebook
- Explorar: Cada módulo tiene su propio README.
- Ejecutar: Archivos .ipynb en Jupyter Notebook. Instalar dependencias con
pip install -r requirements.txt
. - Analizar: Proyectos con análisis exploratorios, limpieza de datos y reportes.