Создание приложения для распознавания текста с изображений и аудиофайл

Бэк-энд и фронтенд-разработка

Приложение для распознавания текста с изображения или аудио из файла. Сервер реализован на Java и Python, фронтенд — на JavaScript, база данных — PostgreSQL.
Архитектура реализована как клиент-сервер, в парадигме MVC.
Для выполнения задачи распознавания текста с изображения используется технология OCR –
обнаружение текстового содержимого на изображениях и перевод изображений в закодированный текст, который компьютер может легко понять.
Для целей OCR использовался пакет PyTesseract, являющейся оболочной для Google Tesseract-OCR Engine.
Для обработки аудио была использована библиотека Speech Recognition.
Исходный код приложения находится в репозитории https://github.com/vadimpechenin/RecognizingTextFromImageApp.git