Компанія Google розробила синтезатор мови нового покоління Tacotron 2, який заснований на нейромережі. Ця система перетворення тексту на мовлення, що природно звучить, Tacotron 2 справляється з цим завданням ефективніше своїх попередників Tacotron і WaveNet, передає "Новое время".
Попередні системи генерації мови мали низку суттєвих недоліків. WaveNet, наприклад, видавала дуже різкі звуки. Tacotron краще справлявся з інтонаціями, але не міг видавати повноцінний "мовний продукт".
Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограму, в якій розподіляються ритм і наголоси, а слова генеруються в аналогу WaveNet. Крім того, додана система збору даних для навчання нейромережі.
Зазначається, що аудіозапис дійсно схожий на мову живої людини. Темп мовлення звучить вельми переконливо, а основні запинки відбуваються на словах з незвичайною вимовою. Щоправда, частина слухачів в коментарях стверджує, що деякі слова система вимовляє "ламано".
Поки зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Але, швидше за все, ця технологія відразу почне використовуватися в продуктах компанії.
Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яка фраза буде виголошена піднесено, а яка – грубо.
Тим часом Microsoft заборонила встановлювати Google Chrome. У корпорації зазначили, що програма має бути "унікальною і відмітною".
Читайте також:
- WhatsApp припинить роботу на деяких смартфонах 2018 року: хто під ударом
- 116-річчя Марлен Дітріх: Google присвятив дудл культовій актрисі
- Google знищить мільйони додатків для Android-смартфонів
- Microsoft заборонила встановлювати Google Chrome
- У Windows 10 знайшли небезпечну уразливість: під загрозою паролі користувачів
- Стали відомі найпопулярніші Google-запити 2017 року