TXH-mercury / VAST Public

Notifications You must be signed in to change notification settings
Fork 14
Star 220

Code and Model for VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

220 stars 14 forks Branches Tags Activity

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
img		img
LICENSE		LICENSE
README.md		README.md

Repository files navigation

VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

This is the official repository of VAST which will provide code, model checkpoint and dataset. They will be released after paper is accepted.

Citation

If you find this code useful for your research, please consider citing:

@article{chen2023vast,
  title={VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset},
  author={Chen, Sihan and Li, Handong and Wang, Qunbo and Zhao, Zijia and Sun, Mingzhen and Zhu, Xinxin and Liu, Jing},
  journal={arXiv preprint arXiv:2305.18500},
  year={2023}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

Citation

About

Releases

Packages

Contributors 2

Languages

License

TXH-mercury/VAST

Folders and files

Latest commit

History

Repository files navigation

VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

Citation

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages