SuperSONIC

The SuperSONIC project implements common server infrastructure for GPU inference-as-a-service to accelerate machine learining algorithms at large high energy physics (HEP) and multi-messenger astrophysics (MMA) experiments. The server infrastructure is designed for deployment at Kubernetes clusters equipped with GPUs.

The main components of SuperSONIC are:

Nvidia Triton inference servers
Dynamic muti-purpose Envoy Proxy:
- Load balancing
- GPU saturation prevention
- Token-based authentication (optional)
Load-based autoscaling via KEDA

Documentation

Documentation
- Installation
- Helm chart parameters

Server diagram

Status of deployment

	CMS	ATLAS	IceCube
Geddes cluster (Purdue)	✅	-	-
Nautilus cluster (NRP)	✅	⏳	✅

Name		Name	Last commit message	Last commit date
Latest commit History 163 Commits
.github/workflows		.github/workflows
ci		ci
docs		docs
helm		helm
values		values
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
deploy-geddes-cms.sh		deploy-geddes-cms.sh
deploy-nautilus-atlas.sh		deploy-nautilus-atlas.sh
deploy-nautilus-cms.sh		deploy-nautilus-cms.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SuperSONIC

Documentation

Server diagram

Status of deployment

About

Releases

Packages

Contributors 5

Languages

fastmachinelearning/SuperSONIC

Folders and files

Latest commit

History

Repository files navigation

SuperSONIC

Documentation

Server diagram

Status of deployment

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Languages

Packages