ВидеоКонф(ВКС)  ::   FAQ  ::   Поиск  ::   Регистрация  ::   Вход

Google's text to speech for asterisk

Раздел для разработчиков для обсуждения программных и аппаратных продуктов и их реализации.

Модераторы: april22, Zavr2008

Re: Google's text to speech for asterisk

Сообщение gosha » 05 апр 2012, 07:43

tma писал(а):Меня больше интересует распознавание.


это не tts называется. Первые две ссылки темы это про tts. У гугля это надо в сторону google-voice-search смотреть. Оно распознает, но не не сильно хорошо.

gosha@gosha-laptop:~tmp$ ./google-voice-search.pl input-access_code.wav16 ru
{"status":0,"id":"e56922d8e513126b6acda0d4233d7de0-1","hypotheses":[{"utterance":"введите код доступа по завершении нажмите решетку","confidence":0.7497835}]}

gosha@gosha-laptop:~tmp$ ./google-voice-search.pl directory-intro0.wav16 ru
{"status":0,"id":"4f0c32c00a0efce203039558c2dab2c0-1","hypotheses":[{"utterance":"дабро пажаловать справочную службу company пожалуйста введите первые 3 буквы а фамилию того кого вы ищите например используйте 7 для букву и двигателя буквы","confidence":0.68460923}]}


было это:
Код: выделить все
input-access_code : "Введите код доступа. По завершению нажмите решётку."
                 
directory-intro0 : "Добро пожаловать в справочную службу компании. Пожалуйста введите первые три буквы фамилии, того кого вы ищите... Например, используйте семь для буквы ''Q' и девять для буквы 'Z'"


скрипты гуглятся, я пользовал это:
http://virtual-pbx.googlecode.com/svn/t ... -search.pl
gosha
 
Сообщений: 371
Зарегистрирован: 06 сен 2010, 17:41

Re: Google's text to speech for asterisk

Сообщение tma » 05 апр 2012, 09:34

zzuz писал(а):ну да , ну да.

Ну а Вы бы взялись за такую задачу? Если отбросить Ваши ничем не обоснованные подтверждения в спаме?
Спамом они и так отдельно занимаются, за что их телекомы постоянно блокируют, обзванивают потенциальных клиентов.
Но в спаме всегда проще прокрутить некую фразу, а не анализировать что их послали на 3 буквы.
Я б руки поотрывал им за это. Но в данном случае даже предполагать, что это спам - глупо.
Правда если нечего ответить, то можно и спамом обозвать, какая разница.
Последний раз редактировалось tma 05 апр 2012, 09:42, всего редактировалось 1 раз.
SkyTel OU - облачная АТС, DID, SIP-транк с посекундной тарификаицей, мобильная связь
http://skytel24.com | Эстония: +372.333.55.10 | Россия: +7(495)4019900
tma
 
Сообщений: 1809
Зарегистрирован: 18 сен 2010, 20:50

Re: Google's text to speech for asterisk

Сообщение tma » 05 апр 2012, 09:41

switch писал(а):Нужно писать алгоритм, который из этого набора слов получит то, что тебе нужно.

На самом деле там скорее нужен анализатор разговора, а не его анализ. Т.е. нужно отделить сообщение IVR от ответа оператора,
зафиксировать временную точку и записать ответ оператора, определить конец фразу, сказать "до свидания" и повесить трубку.
В статистике должна быть приложения запись ответа, а не текст.
Если бы IVR всегда работал одинаково, то можно было бы отталкиваться от задержки на IVR, но Oktell работает непредсказуемо, а так же дергает кучу разных баз, поэтому возникают различные задержки, которые не дают точно рассчитать начало ответа оператора + операторы халявщики, поэтому могут ответить не сразу, а так же с задержкой. Короче возникает очень много "но".
Во втором случае используется DTMF, там немного проще, но все равно проблема: ну пропищал я DTMF, но дальше-то нужно понять кто мне ответил - оператора или все тот же IVR, который почему-то пошел не так, как ему полагалось?
Поэтому я и сомневаюсь в том, что стоит за такую работу браться. Скорее всего потом вылезет еще немерянно граблей...
Может есть что-то готовое?
SkyTel OU - облачная АТС, DID, SIP-транк с посекундной тарификаицей, мобильная связь
http://skytel24.com | Эстония: +372.333.55.10 | Россия: +7(495)4019900
tma
 
Сообщений: 1809
Зарегистрирован: 18 сен 2010, 20:50

Re: Google's text to speech for asterisk

Сообщение Sfinx » 05 апр 2012, 10:38

Последний раз когда-то я ковырялся с этой гуглевской ботвой - в ней была одна мелкая проблема, которая состояла в том, что длина отрезка речи не могла превышать 15 секунд. Все что дальше в flac'е - гугль тупо игнорил. Как вариант можно искать паузы между словами и бить на несколько файлов. Вообще - это все "для поиграться" - уж очень оно тормозит с нашими интернетами - сам иногда юзаю на планшете и телефоне.
Rus

-----------
SfinxSoft
http://sfinxsoft.com
Аватар пользователя
Sfinx
 
Сообщений: 672
Зарегистрирован: 21 июн 2011, 23:40
Откуда: Odessa

Re: Google's text to speech for asterisk

Сообщение tma » 05 апр 2012, 11:58

А чем стандартным в asterisk'е можно сейчас анализировать паузы?
Здесь самое главное не распознать что же там такое говорят, а найти сам факт ответа оператора, а не IVR.
Далее если это оператор - проиграть заранее заданную фразу и записать ответ оператора.
SkyTel OU - облачная АТС, DID, SIP-транк с посекундной тарификаицей, мобильная связь
http://skytel24.com | Эстония: +372.333.55.10 | Россия: +7(495)4019900
tma
 
Сообщений: 1809
Зарегистрирован: 18 сен 2010, 20:50

Re: Google's text to speech for asterisk

Сообщение Vlad1983 » 05 апр 2012, 12:07

можно попробовать распознать IVR по факту произнесения слов: нажмите, тональный и пр., который в ответе оператора в первые несколько секунд вряд ли когда-то встретятся.
ЛС: @rostel
Vlad1983
 
Сообщений: 4251
Зарегистрирован: 09 авг 2011, 11:51

Re: Google's text to speech for asterisk

Сообщение tma » 05 апр 2012, 13:13

Тоже мысль, но тогда нужно иметь пачку вариантов что в каких случаях может произноситься.
Если поменяли IVR (например некое информационное сообщение вставят), то придется весь алгоритм менять.
SkyTel OU - облачная АТС, DID, SIP-транк с посекундной тарификаицей, мобильная связь
http://skytel24.com | Эстония: +372.333.55.10 | Россия: +7(495)4019900
tma
 
Сообщений: 1809
Зарегистрирован: 18 сен 2010, 20:50

Re: Google's text to speech for asterisk

Сообщение Vlad1983 » 05 апр 2012, 13:17

для каждого конкретного "атакуемого" весь алгоритм должен быть заложен в БД.
основная проблема скорей всего сведется именно к корректному распознанию (у многих в IVR музыка в фоне, например).
ЛС: @rostel
Vlad1983
 
Сообщений: 4251
Зарегистрирован: 09 авг 2011, 11:51

Re: Google's text to speech for asterisk

Сообщение tma » 05 апр 2012, 13:35

В данном случае "атакуемый" - один и тот же номер, который нужно периодически тестировать несколько раз в день.
Но поведение IVR может различаться в различных ситуациях. Там сообщается в частности о неисправностях и т.д.
Могут вывесить дополнительно какое-нибудь сообщение, причем забыв известив контролирующую службу, как обычно.
Прозваниваться же номер планируется через GSM-шлюз через разных операторов, чтобы иметь представление, что
вызов проходит успешно через каждого оператора и что хватает емкости через каждого из операторов.
SkyTel OU - облачная АТС, DID, SIP-транк с посекундной тарификаицей, мобильная связь
http://skytel24.com | Эстония: +372.333.55.10 | Россия: +7(495)4019900
tma
 
Сообщений: 1809
Зарегистрирован: 18 сен 2010, 20:50

Re: Google's text to speech for asterisk

Сообщение Vlad1983 » 05 апр 2012, 13:38

тогда проще нанять девочку студентку на пару часов работы на дому
пусть мочит
ЛС: @rostel
Vlad1983
 
Сообщений: 4251
Зарегистрирован: 09 авг 2011, 11:51

Пред.След.

Вернуться в Разработка

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5

© 2008 — 2024 Asterisk.ru
Digium, Asterisk and AsteriskNOW are registered trademarks of Digium, Inc.
Design and development by PostMet-Netzwerk GmbH