Code Samples for `Stream Processing With Apache Spark`

Prerequisites

val sparkVersion = "2.4.3"
libraryDependencies ++= Seq(
  "org.apache.spark" %% "spark-core",
  "org.apache.spark" %% "spark-sql"
).map(_ % sparkVersion)

Get Sample Dataset
1. git clone https://github.com/stream-processing-with-spark/datasets.git
2. cd datasets/NASA-weblogs
3. tar -xvf nasa_dataset_july_1995.tgz
4. mv nasa_dataset_july_1995 /tmp

Clean up Sample Dataset:

rm -rf /tmp/nasa_dataset_july_1995

Chapter 7

run tcp server that delivers logs: sbt 'runMain chapter7.TcpServerRunner'
run spark job: sbt 'runMain chapter7.NasaDatasetStreamed'

Metrics

- configured in `projectRoot/metrics.properties`

run docker-compose:
1. cd docker
2. docker-compose up

Graphite: http://locahost

Grafana

Set up Graphite as a datasource
1. http://locahost:3000
2. http://localhost:3000/datasources
3. Select 'Graphite'
4. config:
  - url: http://graphite:80
  - Access: Server (default)
  - Select Basic Auth - Creds: root/root
  - version: 1.1.x

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
docker		docker
project		project
src/main		src/main
.gitignore		.gitignore
GraphiteDatasource.png		GraphiteDatasource.png
README.md		README.md
SampleMetrics.json		SampleMetrics.json
build.sbt		build.sbt
metrics.properties		metrics.properties

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Code Samples for `Stream Processing With Apache Spark`

Prerequisites

Chapter 7

Metrics

About

Releases

Packages

Languages

agaro1121/stream-processing-with-apache-spark

Folders and files

Latest commit

History

Repository files navigation

Code Samples for Stream Processing With Apache Spark

Prerequisites

Chapter 7

Metrics

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Code Samples for `Stream Processing With Apache Spark`

Packages