Smol Vision 🐣

Recipes for shrinking, optimizing, customizing cutting edge vision models.

	Notebook	Description
Quantization/ONNX	Faster and Smaller Zero-shot Object Detection with Optimum	Quantize the state-of-the-art zero-shot object detection model OWLv2 using Optimum ONNXRuntime tools.
VLM Fine-tuning	Fine-tune PaliGemma	Fine-tune state-of-the-art vision language backbone PaliGemma using transformers.
Intro to Optimum/ORT	Optimizing DETR with 🤗 Optimum	A soft introduction to exporting vision models to ONNX and quantizing them.
Model Shrinking	Knowledge Distillation for Computer Vision	Knowledge distillation for image classification.
Quantization	Fit in vision models using Quanto	Fit in vision models to smaller hardware using quanto
Speed-up	Faster foundation models with torch.compile	Improving latency for foundation models using `torch.compile`
Speed-up/Memory Optimization	Vision language model serving using TGI (SOON)	Explore speed-ups and memory improvements for vision-language model serving with text-generation inference
Quantization/Optimum/ORT	All levels of quantization and graph optimizations for Image Segmentation using Optimum (SOON)	End-to-end model optimization using Optimum
VLM Fine-tuning	Fine-tune Florence-2	Fine-tune Florence-2 on DocVQA dataset

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
.gitignore		.gitignore
Faster_Zero_shot_Object_Detection_with_Optimum.ipynb		Faster_Zero_shot_Object_Detection_with_Optimum.ipynb
Faster_foundation_models_with_torch_compile.ipynb		Faster_foundation_models_with_torch_compile.ipynb
Fine_tune_Florence_2.ipynb		Fine_tune_Florence_2.ipynb
Fine_tune_PaliGemma.ipynb		Fine_tune_PaliGemma.ipynb
Fit_in_vision_models_using_quanto.ipynb		Fit_in_vision_models_using_quanto.ipynb
LICENSE		LICENSE
PaliGemma_DPO.ipynb		PaliGemma_DPO.ipynb
README.md		README.md
Reduce_any_model_to_fp16_using_🤗_Optimum_DETR.ipynb		Reduce_any_model_to_fp16_using_🤗_Optimum_DETR.ipynb
knowledge_distillation.md		knowledge_distillation.md

Provide feedback