BigData_DataLake_AWS

Foram desenvolvidos os conceitos fundamentais do big data, incluindo volume, variedade e velocidade dos dados, aplicada as tecnologias e ferramentas utilizadas no processamento e análise de big data como o Apache Spark e suas características.

Neste exercício foi aplicado os conceitos fundamentais do Spark, como RDDs, DataFrames e Datasets, data wrangling (limpeza, transformação e integração de dados), AWS S3, AWS IAM e AWS Athena para análise exploratória de dados.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
maiapolonio_M41_Exercicio.ipynb		maiapolonio_M41_Exercicio.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BigData_DataLake_AWS

About

Releases

Packages

Languages

Maia-Polonio/BigData_DataLake_AWS

Folders and files

Latest commit

History

Repository files navigation

BigData_DataLake_AWS

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages