Visual Prompt Tuning

Jia, Menglin; Tang, Luming; Chen, Bor-Chun; Cardie, Claire; Belongie, Serge; Hariharan, Bharath; Lim, Ser-Nam

Computer Science > Computer Vision and Pattern Recognition

arXiv:2203.12119v2 (cs)

[Submitted on 23 Mar 2022 (v1), last revised 20 Jul 2022 (this version, v2)]

Title:Visual Prompt Tuning

Authors:Menglin Jia, Luming Tang, Bor-Chun Chen, Claire Cardie, Serge Belongie, Bharath Hariharan, Ser-Nam Lim

View PDF

Abstract:The current modus operandi in adapting pre-trained models involves updating all the backbone parameters, ie, full fine-tuning. This paper introduces Visual Prompt Tuning (VPT) as an efficient and effective alternative to full fine-tuning for large-scale Transformer models in vision. Taking inspiration from recent advances in efficiently tuning large language models, VPT introduces only a small amount (less than 1% of model parameters) of trainable parameters in the input space while keeping the model backbone frozen. Via extensive experiments on a wide variety of downstream recognition tasks, we show that VPT achieves significant performance gains compared to other parameter efficient tuning protocols. Most importantly, VPT even outperforms full fine-tuning in many cases across model capacities and training data scales, while reducing per-task storage cost.

Comments:	ECCV2022
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2203.12119 [cs.CV]
	(or arXiv:2203.12119v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2203.12119

Submission history

From: Menglin Jia [view email]
[v1] Wed, 23 Mar 2022 01:17:16 UTC (2,906 KB)
[v2] Wed, 20 Jul 2022 15:47:22 UTC (2,641 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Visual Prompt Tuning

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Visual Prompt Tuning

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators