R50 13972065dc6e6ba709e1653e5ded45a7
Бэк-энд и фронтенд-разработка

Создание приложения для распознавания текста с изображений и аудиофайл

Добавлено 16 янв 2024 в 20:34
Приложение для распознавания текста с изображения или аудио из файла. Сервер реализован на Java и Python, фронтенд — на JavaScript, база данных — PostgreSQL.
Архитектура реализована как клиент-сервер, в парадигме MVC.
Для выполнения задачи распознавания текста с изображения используется технология OCR –
обнаружение текстового содержимого на изображениях и перевод изображений в закодированный текст, который компьютер может легко понять.
Для целей OCR использовался пакет PyTesseract, являющейся оболочной для Google Tesseract-OCR Engine.
Для обработки аудио была использована библиотека Speech Recognition.
Исходный код приложения находится в репозитории https://github.com/vadimpechenin/RecognizingTextFromImageApp.git
39fea5a823 D13db8b6c6 9dabdf40ac 71c1d0d738 886a06df54 A7894aec8c 42649b1641 1f930fee57