Сделать VAD (voice activity detection) адаптивным

Цена договорная
25 марта 2024, 16:01 • 2 отклика • 43 просмотра
Имеется фронт на react+next.js , в нем есть VAD (voice activity detection), на библиотеке от ricky0123 (на гитхабе есть код [/ricky0123/vad]).


Необходимо допилить, чтобы этот VAD был Адаптивным в процессе работы (в течение одной сессии).

Для чего это нужно? Делаем голосового бота. VAD нужен для того чтобы фильтровать только фразы человека, и после того как человек закончил фразу, только после этого бот начинал обработку этой фразы целиком. У каждого человека свои паузы между словами и предложениями. VAD должен подстраиваться к каждому конкретному человеку.

В нашем случае, в начале разговора с ботом, человек может делать (например) 1-2сек паузы между словами/предложениями, к середине разговора с ботом, паузы между предложениями у человека могут составлять 3-5сек (у каждого человека свои показатели).



Схема работы следующая:
Никаких предоплат ( скамеры не пройдут))) ). Сделал у себя, показал что работает, мы поюзали убедились что работает, получил оплату за работу, закинул исходники. Все счастливы.

---
в отклике сразу пишите:
1. какой имеется опыт, близкий с задачей?
2. сумма/сроки (ваши предполагаемые) на решение данной задачи.
3. контакт в телеграме.

---