Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Согласно спецификации протокола MRCPv2 длительность сеанса распознавания речи абонента определяется следующими параметрами:

  • sct (speech complete timeout) - период ожидания для завершения распознавания речи при полном распознавании. Это период времени с момента прекращения речи абонента, после окончания которого система завершает сеанс распознавания речи. Данный параметр используется, если система распознает все фрагменты речи абонента. Значение параметра задается в миллисекундах.
  • sint (speech incomplete timeout) - период ожидания для завершения распознавания речи при неполном распознавании. Это период времени с момента прекращения речи абонента, после окончания которого система отклоняет неполностью распознанный речевой фрагмент и завершает сеанс распознавания речи. Данный параметр используется, если система распознает не все фрагменты речи абонента. Значение параметра задается в миллисекундах.
  • nit (no input timeout) - период ожидания возобновления распознавания речи. Это период времени после начала распознавания речи, в течение которого система пытается распознать дальнейшую речь абонента. Если системе не удается это сделать, то после окончания этого периода система завершает сеанс распознавания речи. Значение параметра задается в миллисекундах.
  • t - (recognition timeout) - период распознавания речи. Это период времени, в течение которого система пытается распознать речь абонента. Если системе не удается это сделать, то после окончания этого периода система завершает сеанс распознавания речи. Значение параметра задается в миллисекундах.

...

3000

Односложный
ответ
Очень короткаяКороткаяНормальнаяНормальная
(5 сек.)
Нормальная
(180 сек.)
ДлиннаяОчень длиннаяОчень длинная
(180 сек.)
sct10030030080080080010003000
sint1003004009609609601200120030003000
nit40003000 3000 3000 5000 3000 4000 4000 4000 
t70005000500070007000 1800001000015000180000

...

Примечание

Время, через которое ответит бот, не равно длительности сеанса распознавания. Это время высчитывается по следующей формуле:sct +  получение ответа от ASR + время на принятие решения
Прочие звуки после основной речи клиента (до наступления тишины) и пауза в аудиофайле бота, перед началом воспроизведения, может увеличить время ответа бота.

Пример:
Установлена длительность сеанса распознавания Короткая (sint = 0.34 сек.). После завершения речи клиент произнес громкий звук, из-за чего бот начал ожидание ответа на 0.1 сек. позже. После  После наступления тишины и завершения сеанса распознавания потребовалось 0.1 сек. на получение полного ответа от ASR. Прежде чем продолжить, боту потребовалось еще 0.3 сек. на принятие решения. Аудиофайл ответа бота содержал в себе паузу перед началом речи продолжительностью 0.1 сек.
Таким образом общая длительность паузы составляет: 0.1 + 0.3 + 0.1 + 0.3 + 0.1 = 0.9 8 сек.