Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

Одним из наиболее актуальных применений нейронных сетей сегодня, когда потребность в диалоге «человек-машина» стала очевидной, является распознавание естественной звучащей речи. Голосовое управление в промышленных условиях предполагает повышенную зашумленность, поэтому требовалось создать технологию, которая сумела бы отличать речь от шума и адаптироваться к конкретному человеку. Технология группы компаний ЦРТ решает эту задачу за счет алгоритма определения речевой активности диктора на основе нейросетевого классификатора и нового метода адаптации к голосу и каналу.

Новая технология может использоваться для голосового управления станками в шумных заводских цехах, грузовыми автомобилями и другой техникой, работающей на стройках, разработках и в карьерах,  для распознавания команд в шумных многолюдных помещениях.  

«Последние значительные успехи в распознавании речи связаны с применением в акустических моделях глубоких нейронных сетей вместо смесей гауссовых распределений. Результаты проведенных компанией исследований показывают значительное преимущество распознавания речи на базе глубоких нейронных сетей. Это преимущество наиболее ярко проявляется  в условиях увеличения шума», — рассказал директор научно-исследовательского департамента ЦРТ Кирилл Левин.

Продукты и решения на основе технологии распознавания речи – одно из основных направлений работы группы компаний ЦРТ. В их числе сиcтема голосового взаимодействия VoiceNavigator, система речевой аналитики на основе машинного обучения Smart Logger II и другие.

«Участник IT-кластера «Сколково» «ЦРТ-инновации» имеет серьезный опыт в сфере технологий распознавания речи и голосового анализа. Решения компании уже успешно применяются в банковской области, в телекоме. Развитие робототехнических промышленных решений является одним из наиболее интересных направлений для появления стартапов в области человеко-компьютерного взаимодействия, поэтому я уверен, что решение такой критической задачи, как распознавание речи в условиях высокого уровня шума, позволит ЦРТ найти клиентов в промышленной сфере и значительно расширить свое присутствие на рынке» — заявил Sk.ru руководитель направления «Безопасные информационные технологии» IT-кластера Фонда «Сколково» Сергей Ходаков.

Источник: http://sk.ru/news/b/news/archive/2016/05/23/crtinnovacii-nauchila-neyronnye-seti-otlichat-rech-ot-shuma.aspx

----

Эпоха перемен. Подарки. Часть 1.

Эпоха перемен. Подарки. Часть 1. Статья Владислава Боярова. 19.01.2024 г.

Эпоха перемен. Подарки. Часть 2.

Эпоха перемен. Подарки. Часть 2. Статья Владислава Боярова. 23.01.2024 г.

«Домашний компьютер». Конкурс в Самаре.

«Домашний компьютер». Конкурс в Самаре.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность.

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность. Статья Ильи Вайцмана. 11.12.2023 г.