Проект по распознаванию документов (OpenCV, OCR, Tesseract, ML)

100 000 руб. за проект • наличный расчёт, безналичный расчёт
16 января 2019, 20:09 • 17 откликов • 112 просмотров
Привет!

Мы ищем разработчика на проект по распознаванию сканов документов на русском языке. Нужно решение по распознаванию текста и извлечению данных из:

  1. Паспортов
  2. СНИЛС
  3. Свидетельств ИНН / ОГРН
  4. Бухгалтерской отчетности
  5. Текстовых документов (уставы, договоры, протоколы)
У нас уже есть MVP-версия продукта, построенная на API Google Vision, классификации документов с помощью обученной NLP модели и поиске данных с помощью регулярных выражений.

Нужно создать полностью автономное решение, не использующее сторонние API и проприетарный софт, а также кардинально улучшить качество получаемых данных. Предпочтительно Python, но мы открыты и к другим предложениям.

Ищем кандидатов с опытом решения подобных задач.

Наша команда работает с банками и компаниями финансовой сферы уже почти 3 года. Делаем различные сервисы по автоматизации рутинных процессов как для клиентов, так и для работников финансовых компаний. Очень здорово, если тебе интересна эта сфера и хочется развиваться в направлении финтеха. У нас постоянно возникает поток новых задач, а еще мы готовы делиться своими знаниями и опытом!