ИИ ускорит распознавание выражений лиц на видео в 30 раз


Инновационный подход к обработке видео на основе искусственного интеллекта значительно ускоряет процесс распознавания лиц. Новый метод российских ученых может быть до 30 раз быстрее по сравнению с классическими подходами, при этом не уступая им в точности разгадывания эмоций.

Традиционные методы, которые анализируют каждый кадр видео в отдельности, требуют огромных вычислительных ресурсов.  Исследователи из Sber AI Lab, Университета МИСИС и НИУ ВШЭ предложили эффективный и быстрый метод обработки видео, основанный на последовательном анализе и концепции гранулярных вычислений.

«Наш подход является первой попыткой использовать теорию тернарных (three-way) решений для классификации видео. В частности, мы представляем новый подход, основанный на последовательном анализе входных видеоданных с различной детализацией (частотой кадров). Этот метод спроектирован так, чтобы быть очень быстрым и может быть применен к любому способу извлечения характерных признаков лиц на основе глубоких нейросетей без дополнительного обучения всей модели. Мы используем только один параметр — максимально допустимую вероятность ошибок I рода для оценки порогов классификаторов для всех уровней детализации», — пояснил соавтор исследования Андрей Савченко, заместитель директора центра искусственного интеллекта НИТУ МИСИС.

Авторы исследования отмечают, что для оптимизации метода важно не просто собирать информацию со всех кадров видео, но и уметь правильно выстраивать последовательность принятия решений, то есть сразу отсеивать ненужную информации, чтобы оставались только необходимые для классификации данные.

Сейчас на практике для применения метода пока приходится разбивать данные из систем видеонаблюдения на небольшие фрагменты длительностью 1-2 с. В будущих исследованиях необходимо найти достаточно надежный способ определения моментов смены эмоционального состояния, тогда получится значительно ускорить процедуру распознавания, в особенности для эмоций, длящихся десятки секунд. Кроме того, разработанный метод достаточно универсален, поэтому важно попробовать применить его для других задач видеоаналитики, прежде всего, для распознавания и идентификации лиц.

Исследование опубликовано в научном журнале Information Sciences (Q1).