Разработать прототип инструмента для перевода аудиофайлов в текст

30 000 руб. за проект • безналичный расчёт, электронные деньги
10 января 2019, 17:43 • 14 откликов • 71 просмотр
Данная задача - первый тестовый этап в разработке программы.

1. Разработка прототипа.

От инструмента нужно следующее:

После запуска программы она берет из заранее заданной папки mp3 файлы, подключается к Google SpeechKit (https://cloud.google.com/speech-to-text/), с помощью этого инструмента переводит аудио в текст и сохраняет в той же папке отдельными текстовыми файлами.

MP3 файл - запись разговора клиента с оператором. По одному из каналов (левый) общается оператор, по второму (правый) клиент. Длительность подобных звонков может составлять от нескольких секунд до 15 минут.

Формат итоговой расшифровки - в виде диалога с таймингом (в тайминге указывать начало ответа) от двух лиц - оператора и клиента (также нужно уметь отдельно выделять автоинформатора).

Пример:
(00:01:10) - Оператор - Да, конечно, чем могу помочь?
(00:01:15) - Клиент - Подскажите, есть ли у вас двухкомнатные квартиры?
И т.п.

Формат расшифровки - пожелание, но можно рассмотреть и другие варианты.

Для тестирования программы необходимо создать и настроить аккаунт в Google SpeechKit. Первые 60 минут расшифровки в нем бесплатны - этого будет достаточно для тестирования идеи.

Интерфейс для данного прототипа не нужен. Достаточно записать инструкцию по использованию программы (в какое место вставлять данные для подключения в Google SpeechKit, в какое место вставлять путь к папке с исходниками и другие нюансы, на которые нужно обратить внимание)

Для реализации задачи приложу дополнительные mp3 файлы с записями разговоров.

Цена за проект обсуждаемая.

------

Если полученный результат качества расшифровки будет устраивать, в дальнейшем планируется разработка полноценной программы с расширенным функционалом. Эта работа будет оплачиваться и согласовываться отдельно.