Программисты МФТИ научили роботов не сбиваться с пути

Ученые МФТИ сокращают разрыв между виртуальным и реальным миром для робототехники. Новая система использует особый симулятор для точной настройки виртуальной модели робота. Такой «двойник», используя данные о его перемещении, в точности повторяет поведение робота и эффективно обучает алгоритмы для реального мира. Технология важна для создания маневренных и гибких agile-роботов: манипуляторов, курьеров, домашних помощников и других ,сообщили в пресс-службе вуза.

После обучения на уточненной модели робот стал точнее следовать заданной траектории. В эксперименте робот должен был пройти вперед как можно дольше. Робот обученный на уточненной модели идет прямо, в то время как робот обученный стандартным методом сворачивает.

Чтобы антропоморфный робот двигался уверенно и не сбивался с пути, ученым необходимо четко знать его параметры: вес конечностей, демпфирование (подавление колебаний) или трение в суставах. Особенно это важно для обучения с подкреплением, где робот в виртуальной среде методом проб и ошибок учится выполнять задачи, получая «вознаграждение» за успешные действия.

На базе дифференцируемого симулятора MuJoCo-XLA, ученые МФТИ встроили этап «самонастройки» модели прямо в процесс обучения. Используя данные о положении, скорости и управляющих сигналах, симулятор сам вычисляет, как именно нужно изменить массу, трение и инерцию, чтобы поведение виртуального двойника совпало с поведением реального робота.

«Обычно чтобы точно определить параметры робота, на него приходится вешать множество дорогих и неудобных датчиков. Наша модель использует только данные о положении, скорости частей робота и управляющих командах, которые подаются на его моторы. На их основе симулятор оптимизирует параметры и настраивает виртуальную копию робота. Это позволяет уже реальному работу идеально повторять его сценарии», — рассказал Вячеслав Ковалев, аспирант МФТИ, программист лаборатории интеллектуальных технологий робототехники МФТИ.

Эксперименты на двуногом роботе Mini π показали: новый подход на 75% уменьшает отклонение и на 46% увеличивает пройденное расстояние в заданном направлении.

Модель учитывает сложные нелинейные эффекты, такие как трение в редукторах, для оптимизации которых могут использоваться нейронные сети. Это не только повышает точность, но и позволяет роботу экономить энергию, которую он раньше тратил на коррекцию ошибок и неустойчивое движение.

Это открывает путь к созданию agile-роботов — маневренных и гибких роботов, способных плавно передвигаться и быстро адаптироваться к изменениям в окружающей среде.

Препринт исследования опубликован на arxiv org, доклад по теме работы представлен на конференции International Conference on Intelligent Robots and Systems (IROS 2025).