Необходимо разработать ПО для OCR

50 000 руб. за проект • безналичный расчёт
27 августа 2018, 17:07 • 7 откликов • 49 просмотров
Необходимо разработать ПО (Веб сервис) для OCR на вход принимающее изображение документа (фото или скан) на выходе документ с содержимым документа в формате JSON или XML.( То есть имеется api эндпоинт /ocr на который отправляется изображение или пакет изображений. Далее выполняется распознавание, затем по готовности генерируется событие либо просто запись в БД, либо вебхук). В основном это первичные документы бухгалтерского отчёта, накладные, счета-фактуры


  • В качестве входящего изображения может быть графический файл, который может состоять из нескольких страниц. Формат может быть jpg,png,gif,tiff,pdf
  • В качестве движка OCR необходимо использовать open source решения например tesseract
  • Должна быть поддержка извлечения данных в соответствие с форматированием
  • Должна быть поддержка мультиязычности
  • Данные должны быть извлечены и структурированы в виде JSON или XML

Язык реализации: Не важен

Результат работы - рабочий веб сервис с исходниками

ПО должно иметь api для управления.

Образцы первичных документов приложены.

Файлы