Распознавание текста/цифр в табличных документах (Python, Tesseract)
1 000 руб. за проект
•
безналичный расчёт
Привет!
У нас есть решение, которое распознает цифры в табличных документах.
Работает так: мы даем скан/pdf, алгоритм находит таблицу, размечает ее на ячейки, потом содержимое каждой ячейки передает в Tesseract.
Оно немного научено на тестовых документах, распознает нормально.
Есть задачи по поддержке и развитию.
Нужно а) поправить ряд багов б) добавить новый тип табличных документов.
Расскажите про свой опыт – покажу код, обсудим.
У нас есть решение, которое распознает цифры в табличных документах.
Работает так: мы даем скан/pdf, алгоритм находит таблицу, размечает ее на ячейки, потом содержимое каждой ячейки передает в Tesseract.
Оно немного научено на тестовых документах, распознает нормально.
Есть задачи по поддержке и развитию.
Нужно а) поправить ряд багов б) добавить новый тип табличных документов.
Расскажите про свой опыт – покажу код, обсудим.
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.