Технология распознавания речи Microsoft достигла человеческого уровня
Исследователям из компании Microsoft удалось повысить точность программы распознавания речи до человеческого уровня
Как сообщается на сайте компании,результаты последних испытаний показывают, что количество неправильно определенных слов не превышает 6% — результат сравним с уровнем профессионального наборщика, который вводит текст под диктовку.
«Это достижение является кульминацией более чем двадцати лет усилий», — рассказал руководитель исследовательской группы Microsofts Speech & Dialog Джеффри Цвейг.
Отметим, что исследователи побили собственный рекорд — месяц назад они сообщали о 6,3% неправильно определенных слов в метрике Word Error Rate. Система распознавания речи Microsoft задействует нейролингвистические модели, которые группируют слова по общности словообразовательных признаков.
Команда использовала программное обеспечение Microsoft’s Computational Network Toolkit — собственную систему для глубокого обучения. Исходный код проекта доступен на Github.
В дальнейшем Microsoft собирается использовать эту технологию в голосовом помощнике Cortana, игровой приставке Xbox One, а также в других программах с функцией распознавания речи.