Нейросети вышли в сети: как алгоритмы исследуют наш профиль в интернете

Согласно опросу ВЦИОМ, около 86% россиян практически ежедневно проводят время в социальных сетях и мессенджерах. Мы публикуем фотографии, делимся новостями и пишем комментарии под постами, если вдруг в интернете кто-то оказался не прав. Однако вся эта информация, которую мы оставляем в открытом доступе, интересна не только другим пользователям. Ее также могут изучать технологии искусственного интеллекта. Как и для чего ИИ применяют в социальных сетях, порталу наука.рф рассказал профессор факультета информационных технологий и программирования ИТМО, генеральный директор SoMin.ai Александр Фарсеев.

Определить профиль пользователя

Идею применять алгоритмы в социальных сетях в наши дни новацией уже не назовешь. Эти технологии отлично подходят для того, чтобы обработать огромные массивы разрозненной информации, которые люди ежедневно публикуют. Как вспоминает автор проекта, его исследования в этой области начались в 2013 году во время подготовки кандидатской диссертации. В составе международной научной группы Национального университета Сингапура специалист занимался изучением моделей машинного обучения для профилирования пользователей соцсетей (подробнее с этими исследованиями можно ознакомиться здесь). «Я искал такую тему для исследования, которая позволила бы работать не с сухими данными, а позволяющими лучше понять поведение человека, его интересы и намерения», — говорит Александр Фарсеев.

Позднее эти исследования перешли в прикладную область. Разработчики создали цифровое приложение, которое с помощью разных моделей машинного обучения анализирует аккаунты пользователей в социальных сетях. Изучая контент, который человек размещает (текст, картинки и фотографии в профиле), нейросети оценивают предполагаемый возраст, пол, уровень образования, сферу деятельности, семейное положение.

«Это интересная задача, в том числе с математической точки зрения. Важно понимать, что в социальных сетях мы ведем себя не так, как в жизни. И если в реальном мире о человеке можно многое узнать за короткое время, то в интернете эти данные ограничены. Для ИИ это своего рода следы, по которым система формирует портрет человека», — рассказывает эксперт.

Технологию уже активно применяют на практике. Например, коммерческие предприятия используют ее, чтобы сделать рекламу более персонализированной: на основе созданных профилей можно понять, какие товары или услуги будут пользователям наиболее интересны. «Подобным образом работает реклама, которая появляется, когда вы ищете какой-нибудь товар в браузере. Наверняка вы замечали, что через какое-то время вам предлагается больше подобных продуктов», — объясняет ученый.

Более того, программа может определить, экстраверт человек или интроверт. Как правило, на это указывают ошибки в словах, смайлики, цвета на снимках и фильтры, которые применяет пользователь. Анализируя слова и визуальный контент на странице, приложение также способно выявить признаки депрессии, что делает технологию полезной в качестве инструмента для оказания своевременной психологической помощи.

Маршрут по цифровому следу

В настоящий момент специалисты продолжают развивать технологии в этой области. Еще одна модель, которую создали авторы проекта, рекомендует достопримечательности на основе анализа данных из разных социальных сетей. С ее помощью можно узнать, например, какие места у разных групп населения наиболее популярны. Или почему в одних городах жители предпочитают отдыхать в парках, а в других — в ресторанах.


В ходе этой работы исследователи сделали интересное наблюдение. Оказалось, что по той информации, какие типы мест люди посещают, система с высокой точностью (86 процентов) может определить их семейное положение. Такая технология использует более сложные модели: они построены на нескольких типах данных, полученных из разных источников. При этом изучается как персональное поведение отдельных пользователей, так и информация по кластерам — сообществам людей, обладающим схожими интересами. Эту систему чаще всего используют для туристических сервисов и приложений.

ИИ поможет бизнесу

Еще одно новое направление в этой области — так называемые мультимодальные нейросети, способные и видео генерировать, при этом озвучив его, а также создавать изображения или подготовить текст. Такой набор функций делает систему намного умнее, расширяя спектр применения ИИ-технологий — от искусства и дизайна до робототехники и инженерии.

Авторы проекта SOMIN научили эти нейросети автоматически оценивать, какой рекламный контент будет эффективнее еще до его запуска, что помогает предприятиям грамотно построить свои бизнес-стратегии и наладить общий язык с аудиторией. 

Кстати, в каких еще сферах и как будут развивать подобные технологии в России в ближайшие годы, можно узнать в нашем недавнем материале.


Галлюцинации ИИ

Однако у таких инноваций есть и обратная сторона. По мнению Александра Фарсеева, появление умных технологий привело к тому, что определить в социальных сетях, настоящий ли перед нами человек или бот, становится сложнее.

«Это как борьба вирусов и антивирусов. Возникают новые программы, способные взломать систему или имитировать поведение человека в сети. Но одновременно развиваются технологии, которые пытаются с этим бороться», — делится эксперт, добавив, что в этой области упор делается не столько на сами разработки, а на методы управления ими. Например, как сделать так, чтобы нейросеть генерировала только безопасный и этичный контент? Какие факторы нужно учитывать при выборе данных из открытых источников?

«Если раньше модели, которые мы строили, были детерменистичны, то есть объяснимы, то сейчас мы все чаще сталкиваемся с проблемой так называемых галлюцинаций у ИИ. Это такие странные выводы, которые нейросеть может сделать на основе данных, если не ограничить ее определенными рамками», — рассказывает специалист.

Понять, откуда алгоритм взял те или иные данные, бывает сложно и самим разработчикам. А поскольку такие технологии активно применяют обычные пользователи (например, хорошо знакомые нам чат-боты), то разбираться в том, как работают такие алгоритмы — уже не только задача ученых.

«Технологии развиваются настолько быстро, что мы не успеваем понять, что с ними происходит, как они внутри устроены. Поэтому, с одной стороны, важно больше уделять внимания их контролю. А с другой, популяризировать знания об этой области. Разбираться в них необходимо не только специалистам, но и в целом всем людям», — резюмирует эксперт.

Анна Шиховец