Телеграм-бот распознает текст с картинки, которая находится на сайте, высылает этот текст пользователю телеграма.
Для распознавания текста с картинки используется библиотека Tesseract через модуль pytesseract.
Для получения картинки с сайта используется библиотека BeautifulSoup.
Для бота используется библиотека aiogram 2.
В файле config.ini
в корневой директории хранятся токены в формате:
[Telegram]
API_ID =
API_HASH =
USERNAME =
Посмотреть как работает можно на примере бота https://t.me/novospass_bot
Todo:
Добавить кнопки для выбора - посмотреть исходную картинку или получить текстИспользовать aiohttp вместо requestsДобавить сообщение об ожидании загрузки- Добавить тесты
- Добавить проверку на то, что эту картинку уже загружали
- Перейти на webhook