Прорывные программные комплексы для работы со звуком создали в МИФИ

16 августа 2023

В Научно-образовательном центре «Безопасность интеллектуальных киберфизических систем» (НОЦ «БИКС») НИЯУ МИФИ создали уникальный софт для обработки звуковых сигналов.

Программный комплекс «Цифровая шумоочистка искаженных фонограмм» позволяет очищать зашумленный сигнал от сложных помех, таких как речевой хор, то есть выделять на записи слабослышимый или перекрываемый голос. Работающие в автоматическом режиме современные системы могут только убрать «слабые» голоса и выделить «сильный».

Разработка Национального исследовательского ядерного университета (НИЯУ) МИФИ умеет не только выделять голос «на заднем плане», но и улучшать его качество. Для этого ученые создали специальный алгоритм восстановления гармонической структуры человеческой речи. Он работает, если известны хотя бы некоторые ее гармоники. Например, по первым двум низким гармоникам, имеющим самую высокую интенсивность (они находятся в диапазоне от 20 до 1 КгЦ), можно с помощью этого ПО восстановить всю речь и придать ей естественность.

Другая прорывная разработка ученых НИЯУ МИФИ — «Речевая подпись для защиты документов от подделок и фальсификаций». По словам ученых, классическая и электронная подписи уязвимы. Документ, подписанный ручкой, злоумышленник может позднее подредактировать, приписав, например, другие цифры, ведь в этом случае нет связи между защищаемым текстом, автором и подписью. Электронная подпись уже дает связь между защитой и текстом, но не дает связи между автором и защитой, так как злоумышленник может использовать чей-то токен для подписи документа. Речевая же подпись защищает документ полностью.

Чтобы ее создать и связать воедино автора, текст и защиту, человек проговаривает своим голосом основные моменты того документа, который он хочет защитить — сроки, суммы, обязанности сторон, даже весь документ целиком, если необходимо. Затем «подпись голосом» преобразуется в картинку, вставляется в конец документа и распознается с помощью ПО.

В речевую подпись также могут быть включены и другие биометрические данные спикера. Их измеряют с помощью «умных» часов — пульс, давление, температура. Это нужно, чтобы впоследствии можно было оценить психоэмоциональное состояние человека в момент подписания документа и исключить влияние внешних факторов — давления, угроз и т. д.

«Подделать голосовую подпись невозможно — для этого пришлось бы говорить голосом другого человека, но одной похожести будет недостаточно, а голос, сгенерированный специальными системами, прекрасно распознается техникой по определенным меткам. Это как в случае со сгенерированными картинами — с помощью специальных программ всегда можно установить оригинальная перед нами картина или созданная нейронной сетью, — объяснил научный сотрудник Научно-образовательного центра „Безопасность интеллектуальных киберфизических систем“ (НОЦ „БИКС“) НИЯУ МИФИ Александр Алюшин. — Вообще, речевыми технологиями мы занимаемся уже 10 лет, мы вывели определенную закономерность при формировании речевого сигнала, исходя из которой и разработали эти алгоритмы».

Эти проекты представлены на стенде НИЯУ МИФИ на международном военно-техническом форуме «Армия-2023».

Прорывные программные комплексы для работы со звуком создали в МИФИ

Вам может быть интересно

Узорчатый панцирь микроводоросли поможет при медицинской визуализации

Редчайшего морского комара обнаружили впервые за сто лет

Открыта регистрация на хакатон «Лидеры цифровой трансформации»