Yandex Cloud научила ИИ расставлять знаки препинания при распознавании речи
Облачная платформа Yandex Cloud сообщила, что научила ИИ расставлять знаки препинания при распознавании речи. Для этого был обновлен сервис Yandex SpeechKit, предназначенный для синтеза и распознавания речи на базе машинного обучения. Таким образом теперь при переводе голоса в текст сервис сам расставляет необходимые знаки пунктуации.
Разработаны нововведения для улучшения пользовательского опыта в сценариях, где человек напрямую взаимодействует с речевыми технологиями – например, при общении с голосовым помощником, автоматическом транскрибировании (преобразовании голосовой информации в текстовую) или формировании субтитров.
Новую функцию Yandex SpeechKit назвали «Пунктуатор». Она работает и при распознавании в реальном времени, что актуально для сценариев с голосовыми помощниками, и при распознавании предзаписанных аудиофайлов. Распознанный же нейросетью текст, по словам разработчиков, максимально приближен к литературному, чтобы проще восприниматься читателем.
Разработан «Пунктуатор» с помощью двух последовательно работающих моделей машинного обучения, где первая занимается переводом голоса в текст, а вторая – расстановкой знаков препинания, руководствуясь нормами русского языка. К настоящему времени модель уже расставляет все основные пунктуационные знаки. Оценить работу «Пуктуатора», настраиваемого стандартными средствами в API (программном интерфейсе приложения), могут все пользователи Yandex SpeechKit.
Неделей ранее iot.ru рассказывал о появлении в TikTok дополненной реальности. Новый инструмент, получивший название Effect House, создан, чтобы разнообразить форматы контента и дать авторам новые возможности для самовыражения и развлечения аудитории.
Назад