Тестовое задание по CV:

Реализовать пайплайн CV классификации изображений с помощью Pytorch.
Создать сервис на Flask, который может классифицировать картинки собак
Обернуть его в Docker *
Создать телеграм бота для классификации собак *

Датасет ImageWoof

Пайплайн

Используется 2 модели: первая определяет, есть ли на изображении собака, вторая определяет одну из 10 пород ImageWoof. Обе модели Vision Transformer(pytorch-image-models): первый пердобучен на 1000 классах ImageNet, второй -- он же, дообученный на 10 классах ImageWoof.

Выбор архитектуры

На июль 2022 модели на основе Vision Transformer лидируют в классификации ImageNet
Vision Transformer дает лучший результат, чем архитектуры из Imagewoof Leaderboard на 2020-21 (cм. сравнение в arch_compare.ipynb )

Полученные метрики

Точность классификации ImageWoof:

Validation accuracy = 0.93

Предобученная на ImageNet модель vit_large_patch16_224 из репозитория pytorch-image-models дообучилась до этих значений за одну эпоху.

Разведочный анализ

Датасет ImageWoof содержит изображения 10 классов собак, является подмножеством ImageNet, который содержит 1000 классов, из них собаки cосредоточены между 151 и 275 классами (ImageNet Classes). Модели, предобученные на ImageNet, достаточно хорошо определяют наличие собаки на картинке, но недостаточно хорошо различают 10 искомых классов ImageWoof.

Анализ ошибок

Confusion matrix

Наиболее частые ошибки

[('English foxhound', 'Beagle', 41), 
('Beagle', 'English foxhound', 20)]

Чаще всего ошибочно ошибочно определяет English foxhound вместо Beagle. Если подать на вход изображение собаки, не принадлежащей к одной из 10 пород ImageWoof, модель все-равно распределит ее в один из этих классов.

Локальный запуск

Обе модели имеют объем 1.2 GB, ограничение github -- 50 МB на один файл. Большие файлы можно загружать искачивать, установив git lfs:

# add repository
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash

# install git-lfs for ubuntu
sudo apt-get install git-lfs
git lfs install

После этого предобученные модели загрузятся при клонировании репозитория:

git clone https://github.com/boldyshev/vit-woof

# go to project directory
cd vit-woof

Если вы не хотите устанавливать git lfs, можно скачать модели по ссылке. Файлы должны находиться в vit-woof/models:

wget https://github.com/boldyshev/vit-woof/raw/master/models/vit-dog.pt
wget https://github.com/boldyshev/vit-woof/raw/master/models/vit-woof.pt

Запуск Flask приложения в docker контейнере

docker build -t IMG_NAME .
docker run -it --rm -p 5000:5000 IMG_NAME

Перейти по https://localhost:5000/.

Если вы не хотите скачивать предобученные модели, вы можете локально дообучить предобученный трансформер из репозитория pytorch-image-models:

Создание виртуальной среды

conda env create -f environment.yml
conda activate vit-woof
pip install telebot pyTelegramBotAPI

Дообучить модель

# the model will be saved to /models/MODEL_NAME
python finetune.py MODEL_NAME

Flask app

python flask_app.py -n MODEL_NAME

Telegram бот

python telegram_bot.py TOKEN -n MODEL_NAME

Обучал в Google Colab:

vit_woof.ipynb
xresnet50.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
images		images
models		models
static		static
templates		templates
.gitattributes		.gitattributes
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
arch_compare.ipynb		arch_compare.ipynb
breed_labels.json		breed_labels.json
environment.yml		environment.yml
finetune.py		finetune.py
flask_app.py		flask_app.py
telegram_bot.py		telegram_bot.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Тестовое задание по CV:

Пайплайн

Выбор архитектуры

Полученные метрики

Разведочный анализ

Анализ ошибок

Локальный запуск

Запуск Flask приложения в docker контейнере

Создание виртуальной среды

Обучал в Google Colab:

Использованные репозитории

About

Releases

Packages

Languages

boldyshev/vit-woof

Folders and files

Latest commit

History

Repository files navigation

Тестовое задание по CV:

Пайплайн

Выбор архитектуры

Полученные метрики

Разведочный анализ

Анализ ошибок

Локальный запуск

Запуск Flask приложения в docker контейнере

Создание виртуальной среды

Обучал в Google Colab:

Использованные репозитории

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages