Repositorio que almacena los casos de analítica del master en bigdata.
- Antes de iniciar, se debe contar con git, y descargar el código del repositorio github.
- Se debe iniciar un ambiente virtual de python para instalar las dependencias.
- Se proporciona un script para descargar el dataset y los archivos de soporte.
Para ejecutar los scripts, se deben proporcionar las dependencias adecuadas. Con este propósito debemos crear un ambiente virtual.
Se debe entrar en el folder donde se descargó el repo.
$ git clone [email protected]:EdwinFLopez/casos-analitica-mbd.git
$ cd casos-analitica-mbd
$ python -m venv venv
$ source venv/bin/activate
Una vez creado el ambiente virtual, se deben instalar las dependencias:
$ pip install -r requirements.txt
Proyectos realizados en el marco del desarrollo del curso "Analítica de Datos" del Máster en Big Data 2023-2024
Proyecto que realiza un análisis de datos tomados de la página web de la ciudad de New York. La temática es relacionada con los taxis de la ciudad y sus viajes geo referenciados. Se realiza un modelo de predicción.
El proyecto es acerca del análisis de sentimientos y procesamiento de lenguaje natural (NLP), utilizando un dataset proveniente de Twitter.
El proyecto analiza los best reads del sitio "GoodReads", utilizando técnicas de webscraping. Se realiza un modelo de recomendaciones utilizando una matriz de similitud con base en el análisis de similitud del coseno.