AVSpeech-Filtering

Scripts for filtering AVSpeech data using a vision and language transformer. The videos were filtered to select samples with high audio-visual correspondence. The filtered data was used for Self-Supervised Visual-Acoustic Matching.

Note: Github often has issues rendering python notebooks, so the analysis notebook can also be viewed here

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
survey_exs		survey_exs
AVSpeech_filtering.pdf		AVSpeech_filtering.pdf
AVSpeech_filtering.tex		AVSpeech_filtering.tex
README.md		README.md
analysis.ipynb		analysis.ipynb
new_questions.txt		new_questions.txt
questions.txt		questions.txt
references.bib		references.bib
survey_results.py		survey_results.py
vqa_model.py		vqa_model.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AVSpeech-Filtering

About

Releases

Packages

Contributors 2

Languages

arjunrs1/AVSpeech-Filtering

Folders and files

Latest commit

History

Repository files navigation

AVSpeech-Filtering

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages