Google изкуствен интелект се научава да говори правилно китайски и английски език
Google изкуствен интелект базиран на Deep Mind британската компания се учи да произнася правилно, така че те да звучат естествено. Слушането на записи на човешката реч, те са разработили алгоритми, като самообучение на невронна мрежа , които позволяват да говори на английски и китайски език, по-добре отколкото всички роботите преди системи.
За самообучение на тази невронна мрежа е необходимо да се слушат много записи и да научат как се разпределят смисъл променящата се дължина на вълната на звука. Въпреки това не е толкова просто. Аудио запис на човешки глас – е от порядъка на 16,000 звукови модулации. Представете си звукова вълна изображения – нормална форма на вретено графиката. Всяка извивка на вълната генерира хиляди промени в продължителността и амплитудата на звуковата вълна.
Съществуващите речеви генератори работят чрез конкатенация (свързване) фрагменти от записана реч от богата библиотека. Техният звук не е трудно да се разграничи от човешката реч. Вие често чувате конкатенация TTS (текст-т-реч системи) в навигатора: “. Завийте надясно, след това завийте ляво”. Следователно, съществува необходимост от параметрични TTS (като тези, които съществуват във вокодери), които могат да бъдат всяка част от текста на глас, които не са известни предварително и по този начин ще се различава в ухото като жива човешка реч.
WaveNet ще работи като параметричен звуков синтезатор. В параметричен подход, тя се разлага на множество непрекъснато променящите се сигнали. Досега системата на параметри може да работи само с кратки съобщения са предварително известни фрази, но WaveNet ще бъде в състояние да предскаже параметрите на всяка от следващите поради колебания на същата архитектура на невронна мрежа, която позволява на Deep Mind да се научат да разпознават образа. Прогнози на всяка нова настройка ще се основава на опита на всяка от последните прогнози на невронната мрежа, така че по отношение на обучението на невронната мрежа ще расте експоненциално и способността му.
По време на обучението в компютърните са заредени записи с реч на живи хора на английски и китайски. След обучението, разработчиците показват звук от WaveNet , генерирани като собствена фраза. Тази система още се различава от речта на един жив човек, но и не звучи като изкуствен глас на навигатора.
Източник : http://www.popmech.ru/technologies/265642-deep-mind-uchitsya-govorit-po-kitayski-i-po-angliyski/#full
Leave a reply
You must be logged in to post a comment.