Skip to content

gillopy/Coding_Dojo_DS_ML

Repository files navigation

Coding_Dojo_DS_ML

Este repositorio contiene las tareas, proyectos y exámenes realizados durante el programa de Data Science y Machine Learning en Coding Dojo. Cada carpeta está organizada por módulos y áreas de aprendizaje, abarcando desde fundamentos de ciencia de datos hasta modelos avanzados de machine learning.

Estructura del Repositorio

Directory structure:
└── gillopy-Coding_Dojo_DS_ML/
    ├── README.md
    ├── LICENSE
    ├── 1 - DataScience_Fundamentals/
    │   ├── 1 - Python para Ciencia de Datos/
    │   │   ├── 1 - Manejo de cadenas (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Tarea Cadenas.ipynb
    │   │   ├── 2 - Sistema de Calificaciones (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Sistema_calificaciones.ipynb
    │   │   ├── 3 - Análisis de Datos con NumPy (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Analisis_de_datos_numpy.ipynb
    │   │   └── 4 - Proyecto I- Análisis y predicción de ventas-Part 1 (Core)/
    │   │       ├── README.md
    │   │       ├── Code/
    │   │       │   ├── Limpieza.ipynb
    │   │       │   └── limpiezanumpy.ipynb
    │   │       └── data/
    │   │           └── retail_sales_dataset.csv
    │   ├── 2 - Pandas para Ciencia de Datos/
    │   │   ├── 1 - Analisis de datos con Pandas (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── VideoGamesSale.ipynb
    │   │   │   └── data/
    │   │   │       └── vgsales.csv
    │   │   └── 2 - Proyecto I- Parte II (Core)/
    │   │       ├── README.md
    │   │       ├── Code/
    │   │       │   └── Limpieza.ipynb
    │   │       └── data/
    │   │           └── retail_sales_dataset.csv
    │   ├── 3 - Pandas y Visuazualizacion/
    │   │   ├── 1 - Analisis con Pandas (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── Data/
    │   │   │   │   └── EconomicData.csv
    │   │   │   └── Notebooks/
    │   │   │       └── Pandas para Ciencia de Datos II - Analisis con Pandas (Core).ipynb
    │   │   ├── 2 - Proyecto I- Parte III (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── Code/
    │   │   │   │   ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
    │   │   │   │   ├── Exploración y Visualización de Datos Avanzada.ipynb
    │   │   │   │   └── Transformacion y Analisis.ipynb
    │   │   │   └── data/
    │   │   │       └── retail_sales_dataset.csv
    │   │   └── 3 - Simulación del Examen (Core)/
    │   │       ├── README.md
    │   │       ├── Simulacion Examen.ipynb
    │   │       └── user_app_data.csv
    │   ├── 4 - Visualizacion Avanzada para Ciencia de Datos/
    │   │   ├── 1 - Arreglar el gráfico (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Core Arreglar el Grafico.ipynb
    │   │   ├── 2 - Ejercicios de histogramas y boxplots (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Ejercicios de histogramas y boxplots (Core).ipynb
    │   │   ├── 3 - Proyecto I- Parte IV (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── Code/
    │   │   │   │   ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
    │   │   │   │   └── Transformacion y Analisis.ipynb
    │   │   │   └── data/
    │   │   │       └── retail_sales_dataset.csv
    │   │   ├── 4 - Recreando gráfico (Core)/
    │   │   │   ├── README.md
    │   │   │   └── Recreando gráfico (Core).ipynb
    │   │   └── 5 - Proyecto 1-Parte V (Core)/
    │   │       ├── README.md
    │   │       ├── Code/
    │   │       │   ├── 8 - Visualizacion de datos, Proyecto I- Parte IV (Core).ipynb
    │   │       │   ├── Exploración y Visualización de Datos Avanzada.ipynb
    │   │       │   └── Transformacion y Analisis.ipynb
    │   │       └── data/
    │   │           └── retail_sales_dataset.csv
    │   └── Examenes/
    │       ├── Examen de Certificación – Intento 1A/
    │       │   ├── README.md
    │       │   ├── Code/
    │       │   │   └── Examen.ipynb
    │       │   └── Data/
    │       │       └── vgchartz-2024.csv
    │       ├── Examen de Certificación – Intento 2/
    │       │   ├── README.md
    │       │   ├── Code/
    │       │   │   └── Examen 2.ipynb
    │       │   └── Data/
    │       │       └── hotel_bookings.csv
    │       └── Examen de Certificación – Intento 3/
    │           ├── README.md
    │           ├── Code/
    │           │   └── Examen 3.ipynb
    │           └── Data/
    │               └── Telecom.csv
    ├── 2 - Machine_Learning/
    │   ├── 1 - Modelos de Regresion/
    │   │   ├── 1.1 - Regresión - Regresión 1 (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── Code/
    │   │   │   │   └── Ejercicio de Regresión 1 (Core).ipynb
    │   │   │   └── Data/
    │   │   │       └── house_prices.csv
    │   │   ├── 1.2 - Árbol -  Precios de Autos (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── Code/
    │   │   │   │   ├── Predicción de Precios de Autos (Core).ipynb
    │   │   │   │   └── utils.py
    │   │   │   └── Data/
    │   │   │       └── Automobile_data.csv
    │   │   └── 1.3- Árbol - Precios de Vehículos Usados (Core)/
    │   │       ├── README.md
    │   │       ├── Precios de Vehículos Usados (Core).ipynb
    │   │       └── utils.py
    │   ├── 2 - Modelos de Clasificacion/
    │   │   ├── 2.1 - Clasificación basada en arboles - Proyecto 1- Parte final (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── data/
    │   │   │   │   └── retail_sales_dataset.csv
    │   │   │   ├── notebooks/
    │   │   │   │   ├── Proyecto 1- Parte final (Core).ipynb
    │   │   │   │   └── utils.py
    │   │   │   └── reports/
    │   │   │       ├── model_performance_detailed_report.txt
    │   │   │       └── model_performance_report.txt
    │   │   ├── 2.2- Clasificación básica - Predicción de Calidad del Vino (Core)/
    │   │   │   ├── Readme.md
    │   │   │   ├── Code/
    │   │   │   │   ├── 4 - Clasificación básica Predicción de Calidad del Vino (Core) copy.ipynb
    │   │   │   │   └── utils.py
    │   │   │   ├── Data/
    │   │   │   │   └── WineQT.csv
    │   │   │   └── PDF/
    │   │   ├── 2.3 - Clasificación basada en arboles - Proyecto 2-Parte I (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── EDA/
    │   │   │   │   ├── 1- EDA cancer.ipynb
    │   │   │   │   ├── 2- EDA gym.ipynb
    │   │   │   │   ├── 3- EDA heart.ipynb
    │   │   │   │   ├── 4- EDA behavior.ipynb
    │   │   │   │   └── utils.py
    │   │   │   ├── datasets/
    │   │   │   │   ├── 1-cancer.csv
    │   │   │   │   ├── 2-gym_members_exercise_tracking.csv
    │   │   │   │   ├── 3-heart.csv
    │   │   │   │   └── 4-user_behavior_dataset.csv
    │   │   │   └── selected_dataset/
    │   │   │       ├── EDA heart.ipynb
    │   │   │       ├── heart.csv
    │   │   │       └── utils.py
    │   │   ├── 2.4 - Clasificación y Optimización de Hiperparámetros (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── 11 - Clasificación y Optimización de Hiperparámetros (Core).ipynb
    │   │   │   └── utils.py
    │   │   └── 2.5 - Optimización - Proyecto 2-Parte II (Core)/
    │   │       ├── README.md
    │   │       ├── Proyecto 2-Parte 2 (Core).ipynb
    │   │       ├── heart.csv
    │   │       └── utils.py
    │   ├── 3 - Boosting/
    │   │   ├── 3.1 - LGBM - Clasificación utilizando LightGBM (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── code/
    │   │   │   │   ├── Clasificación utilizando LightGBM (Core).ipynb
    │   │   │   │   └── utils.py
    │   │   │   └── data/
    │   │   │       └── loan.csv
    │   │   ├── 3.2 - SVM - Challenge Técnico (Core)/
    │   │   │   ├── README.md
    │   │   │   ├── 6 - Challenge Tecnico (Core).ipynb
    │   │   │   ├── submission.csv
    │   │   │   ├── test.csv
    │   │   │   ├── train.csv
    │   │   │   └── utils.py
    │   │   └── 3.3 - XGBOOST - Clasificación utilizando XGBoost (Core)/
    │   │       ├── README.md
    │   │       ├── Clasificación utilizando XGBoost (Core).ipynb
    │   │       └── utils.py
    │   └── Examenes/
    │       ├── Examen de certificación – Intento 1/
    │       │   ├── README.md
    │       │   ├── Code/
    │       │   │   ├── Examen de certificación – Intento 1.ipynb
    │       │   │   └── utils.py
    │       │   └── Data/
    │       │       └── HousePrices/
    │       │           ├── data_description.txt
    │       │           ├── sample_submission.csv
    │       │           ├── test.csv
    │       │           └── train.csv
    │       ├── Examen de certificación – Intento 2/
    │       │   ├── README.md
    │       │   ├── Code/
    │       │   │   ├── Examen de certificación – Intento 2.ipynb
    │       │   │   └── utils.py
    │       │   └── Data/
    │       │       └── diabetes.csv
    │       └── Examen de certificación – Intento 3/
    │           ├── README.md
    │           ├── Examen de certificación – Intento 3.ipynb
    │           └── utils.py
    └── 3 - Advance_Machine_Learning/
        ├── 1 - Aprendizaje no supervisado/
        │   ├── 1.1 - Dimensionalidad - PCA (Core)/
        │   │   ├── README.md
        │   │   ├── Reducción de dimensionalidad - PCA (Core).ipynb
        │   │   └── utils.py
        │   ├── 1.2 - Reducción de dimensionalidad - PCA 2 (Core)/
        │   │   ├── README.md
        │   │   ├── Dimensionalidad - PCA 2 (Core).ipynb
        │   │   └── utils.py
        │   ├── 1.3 - Ingeniería de Características - Creación de Nuevas Variables (Core)/
        │   │   ├── Creación de Nuevas Variables (Core).ipynb
        │   │   └── utils.py
        │   ├── 1.4 - Ingeniería de Características - Transformaciones de Variables (Core)/
        │   │   ├── Transformaciones de Variables (Core).ipynb
        │   │   ├── utils.py
        │   │   └── datasets/
        │   │       └── house-prices/
        │   │           ├── data_description.txt
        │   │           ├── house-prices-advanced-regression-techniques.zip
        │   │           ├── sample_submission.csv
        │   │           ├── test.csv
        │   │           └── train.csv
        │   ├── 1.5 - Clusterización - Algoritmo K-means (Core)/
        │   │   ├── README.md
        │   │   ├── 15 - Algoritmo K-means (Core).ipynb
        │   │   └── utils.py
        │   ├── 1.6 - Clusterización - Métricas de Agrupamiento (K-means y DBSCAN) (Core)/
        │   │   ├── README.md
        │   │   ├── Agrupamiento (K-means y DBSCAN) (Core).ipynb
        │   │   └── utils.py
        │   ├── 1.7 - Clusterización - DBSCAN (Core)/
        │   │   ├── DBSCAN (Core).ipynb
        │   │   └── utils.py
        │   └── data/
        │       ├── data/
        │       │   └── titanic/
        │       │       ├── gender_submission.csv
        │       │       ├── test.csv
        │       │       ├── titanic.zip
        │       │       └── train.csv
        │       └── titanic/
        │           ├── gender_submission.csv
        │           ├── test.csv
        │           ├── titanic.zip
        │           └── train.csv
        ├── 2 - Aprendizaje profundo/
        │   ├── 1 - MLP Básica (Core)/
        │   │   └── Aprendizaje profundo - MLP Básica (Core).ipynb
        │   ├── 2 - MLP con Early Stopping y Dropout (Core)/
        │   │   └── Aprendizaje profundo - MLP con Early Stopping y Dropout (Core).ipynb
        │   ├── 3 - Reducción de Dimensionalidad y Benchmarking de Modelos (Core)/
        │   │   ├── Reducción de Dimensionalidad y Benchmarking de Modelos (Core).ipynb
        │   │   └── utils.py
        │   └── 4 - Redes Neuronales Recurrentes y Prophet para Predicción de Series Temporales (Core)/
        │       └── Redes Neuronales Recurrentes y Prophet.ipynb
        └── Examenes/
            ├── Examen de certificación – Intento 1/
            │   ├── README.md
            │   └── Code/
            │       ├── Examen de certificación – Intento 1.ipynb
            │       ├── utils.py
            │       └── Informe/
            └── Examen de certificación – Intento 2/
                ├── README.md
                ├── Code/
                │   ├── Examen de certificación – Intento 2.ipynb
                │   └── utils.py
                └── Informe/

Estructura de un Curso de Ciencia de Datos

Fundamentos

  • Manejo y análisis de datos: Ejercicios prácticos con Python y NumPy.
  • Proyectos iniciales: Predicción de ventas.
  • Visualización: Gráficos básicos y avanzados con Matplotlib y Seaborn.

Machine Learning

  • Modelos de regresión: Predicción de precios.
  • Clasificación: Árboles de decisión y otros algoritmos.
  • Análisis exploratorio: Datasets reales para predicciones y descripciones.

Evaluación

  • Simulaciones: Pruebas de certificación.
  • Proyectos integradores: Datasets variados (ventas, vino, etc.).

Herramientas

  • Lenguajes: Python
  • Bibliotecas: NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn
  • Entorno: Jupyter Notebook

Cómo usar este repositorio

  • Explorar: Cada módulo tiene su propio README.
  • Ejecutar: Archivos .ipynb en Jupyter Notebook. Instalar dependencias con pip install -r requirements.txt.
  • Analizar: Proyectos con análisis exploratorios, limpieza de datos y reportes.

About

Repositorio de tareas y exámenes del Coding Dojo.

Resources

License

Stars

Watchers

Forks

Packages

No packages published