Технологія розпізнавання мови Microsoft досягла людського рівня
Дослідникам з компанії Microsoft вдалося підвищити точність програми розпізнавання мови до людського рівня
Як повідомляється на сайті компанії, результати останніх випробувань показують, що кількість неправильно визначених слів не перевищує 6% – результат можна порівняти з рівнем професійного складача, який вводить текст під диктовку.
«Це досягнення є кульмінацією більш ніж двадцяти років зусиль», – сказав керівник дослідницької групи Microsofts Speech & Dialog Джеффрі Цвейг. Дослідники побили власний рекорд – місяць тому вони повідомляли про 6,3% неправильно визначених слів в метриці Word Error Rate.
Команда використовувала програмне забезпечення Microsoft’s Computational Network Toolkit – власну систему для глибокого навчання. Вихідний код проекту доступний на Github. Система розпізнавання мови Microsoft задіє нейролінгвістичного моделі, які групують слова за спільністю словотворчих ознак.
Надалі Microsoft збирається використовувати цю технологію в голосовому помічнику Cortana, ігровій приставці Xbox One, а також в інших програмах з функцією розпізнавання мови.