Add Multilingual Spoken Words Corpus to list #24

Ekhao · 2024-08-16T07:19:19Z

I stumbled over this great list of voice datasets but noticed that the "Multilingual Spoken Words Corpus" dataset is missing.

Url: https://mlcommons.org/datasets/multilingual-spoken-words/
Short Description: MLCommons Multilingual Spoken Words Corpus is a large and growing audio dataset of spoken words in 50 languages for academic research and commercial applications in keyword spotting and spoken term search, licensed under CC-BY 4.0. The dataset contains more than 340,000 keywords, totalling 23.4 million 1-second spoken examples (over 6,000 hours).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add Multilingual Spoken Words Corpus to list #24

Add Multilingual Spoken Words Corpus to list #24

Ekhao commented Aug 16, 2024

Add Multilingual Spoken Words Corpus to list #24

Add Multilingual Spoken Words Corpus to list #24

Comments

Ekhao commented Aug 16, 2024