Microsoft навчила штучний інтелект розмовляти по-людськи

+38/050/370-3627
+38/093/220-0872
+38/044/257-2444

Головна › Новини › Microsoft навчила штучний інтелект розмовляти по-людськи

26 вересня 2018

Microsoft навчила штучний інтелект розмовляти по-людськи

Дослідники з Microsoft зробили записи комп'ютерного голосу, що імітує людську мову. Для подолання труднощів традиційної моделі вони використовували нейронні мережі синтезу промови. Microsoft обіцяє забезпечити підтримку 49 мов і можливість створення унікальних голосів для потреб компаній у найближчому майбутньому.

Просодика

Синтез мови з допомогою нейронних мереж передбачає порівняння наголосу і протяжності (т. н. просодика) одиниць мови, що говорить, а також їх синтез в комп'ютерний голос. У системах традиційного синтезу мови просодику поділяють на акустичний і лінгвістичний аналіз, якими керують різні моделі. У результаті мова виходить галасливою і невиразною. Представники Microsoft стверджують, що в моделі нейронного синтезу два етапи об'єднані в один, тому голос звучить схожим на реальний.

Розробники переконані, що синтез мови з допомогою нейронних мереж зробить більш природним спілкування з віртуальними співрозмовниками та помічниками. Більше того, це дасть можливість конвертувати електронні книги в аудіокниги та дозволить змінити озвучення вбудованих в автомобілі навігаторів.

Обчислювальні потужності Azure доступні для використання в реальному часі, і за це відповідає служба Azure Kubernetes. Одночасне застосування нейронного синтезу мови разом з традиційним говорять про розширення та підвищення доступності сервісу. Поки що в системі є жіночий голос на ім'я Jessa і чоловічий з ім'ям Guy.

Microsoft змагається у технологіях розпізнавання та синтезу мови з Google, яка оновила свої сервіси в кінці серпня 2018 року. Команда Google Cloud оголосила про випуск стабільного API для синтезу мови Cloud Text-to-Speech з експериментальною функцією аудіопрофілів і підтримкою кількох нових мов. У той же час сервіс для розшифровки аудіо Cloud Speech-to-Text навчився розпізнавати різних спікерів і самостійно визначати мову запису з кількох можливих.

Інші новини

Найкраща ціна

Microsoft
Windows 11 Professional

10 483.00 грн

Microsoft
Windows 11 Professional

10 483.00 грн

Norton by Symantec
Norton Security Premium

4 619.00 грн

Авторизація

Реєстрація

Нагадати пароль