Zeshawn_Project1

Project Description

A simple Hive MapReduce application that utilizes Hive to analyze very large data sets

Technologies Used

-Scala 2.13.3 -Hadoop 3.2.1 -Hive -YARN -sbt 1.4.4 -Docker container

Features

InputStream - Retrieves twitter stream with Spark session
dataMapper - Maps every key in the dataframe to a value
dataReduce - Reduces the datasets so that all the keys are distinct values

Getting Started

MapReduce
Install & Configure git
Install xCode for easy access

Usage

sbt assembly to package files
sbt compile to build
sbt run to output

Contributors

Zeshawn Manzoor

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.bloop		.bloop
.bsp		.bsp
.metals		.metals
.vscode		.vscode
input		input
project		project
src/main/scala		src/main/scala
target		target
README.md		README.md
build.sbt		build.sbt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Zeshawn_Project1

Project Description

Technologies Used

Features

Getting Started

Usage

Contributors

About

Releases

Packages

Languages

revature-scalawags/Zeshawn_Project1

Folders and files

Latest commit

History

Repository files navigation

Zeshawn_Project1

Project Description

Technologies Used

Features

Getting Started

Usage

Contributors

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages