Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

Одним из наиболее актуальных применений нейронных сетей сегодня, когда потребность в диалоге «человек-машина» стала очевидной, является распознавание естественной звучащей речи. Голосовое управление в промышленных условиях предполагает повышенную зашумленность, поэтому требовалось создать технологию, которая сумела бы отличать речь от шума и адаптироваться к конкретному человеку. Технология группы компаний ЦРТ решает эту задачу за счет алгоритма определения речевой активности диктора на основе нейросетевого классификатора и нового метода адаптации к голосу и каналу.

Новая технология может использоваться для голосового управления станками в шумных заводских цехах, грузовыми автомобилями и другой техникой, работающей на стройках, разработках и в карьерах,  для распознавания команд в шумных многолюдных помещениях.  

«Последние значительные успехи в распознавании речи связаны с применением в акустических моделях глубоких нейронных сетей вместо смесей гауссовых распределений. Результаты проведенных компанией исследований показывают значительное преимущество распознавания речи на базе глубоких нейронных сетей. Это преимущество наиболее ярко проявляется  в условиях увеличения шума», — рассказал директор научно-исследовательского департамента ЦРТ Кирилл Левин.

Продукты и решения на основе технологии распознавания речи – одно из основных направлений работы группы компаний ЦРТ. В их числе сиcтема голосового взаимодействия VoiceNavigator, система речевой аналитики на основе машинного обучения Smart Logger II и другие.

«Участник IT-кластера «Сколково» «ЦРТ-инновации» имеет серьезный опыт в сфере технологий распознавания речи и голосового анализа. Решения компании уже успешно применяются в банковской области, в телекоме. Развитие робототехнических промышленных решений является одним из наиболее интересных направлений для появления стартапов в области человеко-компьютерного взаимодействия, поэтому я уверен, что решение такой критической задачи, как распознавание речи в условиях высокого уровня шума, позволит ЦРТ найти клиентов в промышленной сфере и значительно расширить свое присутствие на рынке» — заявил Sk.ru руководитель направления «Безопасные информационные технологии» IT-кластера Фонда «Сколково» Сергей Ходаков.

Источник: http://sk.ru/news/b/news/archive/2016/05/23/crtinnovacii-nauchila-neyronnye-seti-otlichat-rech-ot-shuma.aspx

----

Информационная гигиена в эпоху интернета

Информационная гигиена в эпоху интернета. Статья Владислава Боярова. 12.08.2024 г.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая. Статья Владислава Боярова. 12.03.2024 г.

«КАТЮША» в «Пастернаке»: «КАТЮША»

«КАТЮША» в «Пастернаке»: «КАТЮША». Статья Владислава Боярова. 08.04.2024 г.

Pantum в Самаре: business as usual

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность.

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность. Статья Ильи Вайцмана. 11.12.2023 г.