Modular Quantization-Aware Training for 6D Object Pose Estimation

Javed, Saqib; Li, Chengkun; Price, Andrew; Hu, Yinlin; Salzmann, Mathieu

Computer Science > Computer Vision and Pattern Recognition

arXiv:2303.06753 (cs)

[Submitted on 12 Mar 2023 (v1), last revised 4 Nov 2024 (this version, v3)]

Title:Modular Quantization-Aware Training for 6D Object Pose Estimation

Authors:Saqib Javed, Chengkun Li, Andrew Price, Yinlin Hu, Mathieu Salzmann

View PDF HTML (experimental)

Abstract:Edge applications, such as collaborative robotics and spacecraft rendezvous, demand efficient 6D object pose estimation on resource-constrained embedded platforms. Existing 6D pose estimation networks are often too large for such deployments, necessitating compression while maintaining reliable performance. To address this challenge, we introduce Modular Quantization-Aware Training (MQAT), an adaptive and mixed-precision quantization-aware training strategy that exploits the modular structure of modern 6D pose estimation architectures. MQAT guides a systematic gradated modular quantization sequence and determines module-specific bit precisions, leading to quantized models that outperform those produced by state-of-the-art uniform and mixed-precision quantization techniques. Our experiments showcase the generality of MQAT across datasets, architectures, and quantization algorithms. Remarkably, MQAT-trained quantized models achieve a significant accuracy boost (>7%) over the baseline full-precision network while reducing model size by a factor of 4x or more. Our project website is at: this https URL

Comments:	Accepted to Transactions on Machine Learning Research (TMLR), 2024
Subjects:	Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Robotics (cs.RO)
Cite as:	arXiv:2303.06753 [cs.CV]
	(or arXiv:2303.06753v3 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2303.06753

Submission history

From: Saqib Javed [view email]
[v1] Sun, 12 Mar 2023 21:01:54 UTC (219 KB)
[v2] Wed, 29 Nov 2023 01:17:18 UTC (402 KB)
[v3] Mon, 4 Nov 2024 14:32:02 UTC (3,023 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Modular Quantization-Aware Training for 6D Object Pose Estimation

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Modular Quantization-Aware Training for 6D Object Pose Estimation

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators