Оцифровать и передать: как Бурятия сохраняет родные языки с помощью современных технологий

Цифровизация языков позволяет народам России не только сохранять свою идентичность, но и укреплять национальное единство посредством межрегиональных связей. В соответствии с указом Президента Владимира Путина 2026 год проходит в стране под эгидой Года единства народов России. В материале «Единство в многообразии: как цифровые технологии помогают народам России оставаться собой» мы уже начали рассказывать о государственной языковой политике, онлайн-ресурсах и технологических процессах цифровизации.


Продолжая тему, Наука РФ предлагает узнать, как сегодня сохраняют родные языки народов в Республике Бурятии. Заместитель директора Республиканского центра «Бэлиг» Оюна Забанова поделилась, как создаются цифровые продукты и обучающие сайты, а также рассказала о сотрудничестве с Федеральным агентством по делам национальностей, Домом народов России и с технологической компанией «Яндекс».

Языки народов Бурятии

Республику Бурятия, входящую в состав Дальневосточного федерального округа, называют одним из самых красивых регионов страны. Озеро Байкал, горная система Восточный Саян, Забайкальский национальный парк и многие другие достопримечательности вызывают неизменный интерес у туристов. Но Бурятия уникальна еще и тем, что здесь сохраняют и развивают родные языки народов. Государственные языки республики — русский и бурятский, однако наряду с ними в систему образования включены также эвенкийский и сойотский языки. О статистике изучения языков в школах региона рассказала Оюна Забанова — заместитель директора Республиканского центра «Бэлиг» — руководитель Республиканского центра по развитию бурятского языка, кандидат филологических наук:

«Русский язык в республике изучают все школьники, обучение всем предметам ведется на русском. Около 95 тысяч детей (64% от общего числа учащихся) изучают бурятский язык в двух формах: как родной и как государственный. В свою очередь эвенкийский язык учат 200 школьников, а сойотский язык у нас преподают в Сорокской сойотской школе-интернате среднего общего образования, находящейся в Окинском сойотском муниципальном округе. Там язык изучают 37 учащихся. Наш центр „Бэлиг“ издает учебники и учебные пособия на всех четырех языках. Если изначально, в 1992 году, „Бэлиг“ был создан Министерством образования и науки Бурятии только как отраслевое книжное издательство, то впоследствии его функции значительно расширились. Сегодня ключевая задача центра — поддержка изучения национальных языков и иных предметов этнокультурной направленности. Кроме учебной литературы, мы полностью удовлетворяем запросы системы образования республики на учебно-методическую, научно-популярную, детскую и художественную литературу национально-регионального направления. Большой объем работы у нас проводится по созданию и обновлению учебников, что подразумевает также и разработку их электронной версии».

В 2020 году на базе РЦ «Бэлиг» была воссоздана Государственная служба языкового перевода. Как отметила Оюна Забанова, значительный вклад в реализацию этого проекта внес директор центра Баир Дашеевич Балданов, почетный работник общего образования Российской Федерации. За годы работы службой было переведено на бурятский язык около 700 законов и свыше 6,5 тысяч нормативно-правовых актов, включая указы, постановления и распоряжения главы и правительства Республики Бурятии.

«У нас заключено трехстороннее соглашение между Министерством образования и науки Республики Бурятии, Министерством образования Иркутской области и Министерством образования, науки и молодежной политики Забайкальского края о создании единого образовательного пространства в области преподавания бурятского языка. Есть отдельные соглашения с Забайкальским краем и Иркутской областью по взаимодействию и совместной деятельности в целях сохранения и развития бурятского языка. Мы координируем эту деятельность согласно реализации Стратегии развития бурятского языка, курируем реализацию государственной программы „Сохранение и развитие бурятского языка в Республике Бурятия“. Поэтому у нас проходит очень много мероприятий межрегионального и международного статуса. Например, Международный конкурс профессионального мастерства „Эрхим багша — Лучший учитель“, межрегиональные профильные смены с погружением в бурятскую языковую среду для учащихся 7-8 классов Республики Бурятии, Иркутской области и Забайкальского края. Каждые два года проводится Межрегиональный съезд учителей бурятского языка и литературы, также проходят межрегиональные конкурсы, фестивали, игры по развитию и популяризации бурятского языка и литературы», — добавила заместитель директора.

РЦ «Бэлиг» выступает и в качестве регионального координатора Всебурятского диктанта «Эрдэм» («Знание»), Межрегиональной олимпиады по родным языкам народов Сибири и Дальнего Востока, Международного дня родного языка, Дня языков народов Российской Федерации и Всероссийского конкурса «Лучший учитель родного языка и литературы».

В 2025 году по решению главы Республики Бурятии Алексея Цыденова в структуре центра был открыт Отдел разработки учебно-методических комплексов (УМК) и цифровизации обучения бурятскому языку, что особенно актуально в контексте развития современных цифровых технологий.

Онлайн-ресурсы для изучения языков

Сегодня потребность в доступных и интерактивных цифровых решениях есть как у детей, так и у их наставников, педагогов. К решению задач по сохранению бурятского языка и созданию цифровых платформ в республике подключились не только профессиональные сообщества, но и общественные организации. Сайт nomto.ru для обучения языку дошкольников и учеников младших классов был создан Землячеством уроженцев Тункинского района «Саяны». В 2025 году активисты передали разработку РЦ «Бэлиг».

«Мы провели большую работу по наполнению этого сайта, подготовили и разместили более 100 онлайн-уроков. Эти материалы мы представили на III Межрегиональном съезде учителей бурятского языка и литературы. Сайт работает как цифровой учебно-методический комплекс, который полностью соответствует программе обучения бурятскому языку детей дошкольного возраста, не владеющих бурятским языком. Возрастных ограничений нет, онлайн-ресурс позволяет знакомиться с обучающими интерактивными материалами детям от 0+. Но это не единственный наш онлайн-ресурс для изучения языка. Для школьников мы разрабатываем также сайт bodol.ru, его название в переводе с бурятского означает „мысль“. Данный ресурс будет предназначен для учителей и учащихся по учебному предмету „Государственный бурятский язык“, пока он ориентирован на начальное основное общее образование. Материалы сайта будут постоянно дополняться, здесь же будут размещены электронные версии учебников по бурятскому языку и литературе», — прокомментировала Оюна Забанова.


В условиях ускоренной цифровизации образовательного пространства онлайн-ресурсы позволяют создавать равные возможности для доступа к дополнительным обучающим материалам как для детей, так и для воспитателей и педагогов, независимо от места их проживания. Учащиеся и учителя из отдаленных районов и сельской местности могут получать такую же качественную помощь в обучении и профессиональном развитии, как и жители столицы республики.

Работа с большими данными

При поддержке Федерального агентства по делам национальностей технологическая компания «Яндекс» и Дом народов России работают над развитием проекта по сохранению языков народов России. Как ключевой сервис инициативы «Яндекс Переводчик» последовательно расширяет языковой охват, так, в 2026 году сервис поддерживает уже 18 российских языков, включая бурятский. Сотрудники РЦ «Бэлиг» подключились к масштабной работе над машинным переводом языка региона еще в 2022 году. При содействии главы Республики Бурятии Алексея Цыденова в 2023 году было выделено финансирование, и около 20 новых специалистов, таких как переводчики, редакторы и корректоры, приступили к работе с текстами.


«Компания „Яндекс“ прислала нам один миллион предложений, этот корпус включает достаточно сложную лексику с использованием терминологии медицинской, юридической и IT-сферы, а также из многих других областей. Нашим экспертам приходилось часто дискутировать, принимая решения о новых для языка терминах. С 2024 года мы передали компании 160 000 параллельных предложений, подготовленных нашими экспертами, собрали монокорпус бурятского языка, состоящий из более двух миллионов предложений только на бурятском языке. Для обучения и проверки модели нами было проверено три сложных набора данных — датасета. Предварительную (бета-) версию „Яндекс Переводчик“ представил в 2025 году в День бурятского языка, теперь пользователи с помощью сервиса могут переводить как с бурятского, так и на него. Чтобы сервис обучился и смог переводить без ошибок, нам нужно подготовить переводы еще около одного миллиона предложений», — добавила заместитель директора Республиканского центра «Бэлиг».


По синтезу речи, преобразованию текста в аудиосигнал, специалисты РЦ «Бэлиг» передали в «Яндекс Переводчик» датасет из 3 600 фраз общей длительностью 12 часов, причем дополнительно в студии «Яндекса» было записано еще столько же часов аудиоматериала. Если в работе над синтезом речи сотрудники центра задействовали двух дикторов, то к направлению распознавания речи, преобразования аудио в текстовый формат, привлекли порядка 20 специалистов центра и активистов. Они записали 34 000 аудиоматериалов продолжительностью 57 часов. А в ходе трехэтапной проверки данных силами сотрудников центра были проанализированы 92 000 предложений.

«Для автоматизации процессов по сбору и обработке аудиоматериалов сотрудники нашего отдела разработки УМК и цифровизации обучения бурятскому языку создали нового бота в MAX. Таким образом, в апреле этого года мы направили в „Яндекс“ уже более 27 000 аудиозаписей по распознаванию речи общей длительностью 40 часов. Выборка у нас была гендерная и по возрастным группам: мужской и женский голоса, а также голоса молодого поколения, среднего возраста и старшей возрастной группы. Еще отмечу то, что большой объем подготовленных нами для „Яндекса“ материалов позволил ускорить включение бурятского языка в приложение „Яндекс Клавиатура“ для смартфонов. При вводе текста теперь можно использовать буквы бурятского алфавита, не имеющие аналогов в русском языке: „ү“, „өө“, „һ“. Функция автоматического перевода доступна, например, и при отправке сообщений», — резюмировала кандидат филологических наук.

Сохранение бурятского языка и культуры

Решает ли цифровизация вопрос сохранения языков народов России для следующих поколений? Эксперты РЦ «Бэлиг» убеждены, что в отрыве от самобытной культуры регионов это сделать невозможно, поскольку через язык передаются историческая память и уникальная система ценностей народов страны.

«В целом, для восточного человека, для бурята, в частности, важна связь с природой. Это обусловлено мировосприятием и миропониманием нашего народа. Богатство языка, безусловно, раскрывает обычаи и культуру края, но даже самые качественные переводы не всегда могут передать полноту смыслов. Например, если перевести с бурятского „энэ буянта хүн“ на русский — „это добродетельный человек“, то понятие „буян“ будет несколько отличаться по смыслу от русского слова „добродетель“. На бурятском языке подразумевается нечто кармическое, то, что формируется не только твоими действиями, но и поступками твоих предков, предыдущих поколений, тем, как они прожили свои жизни. Если предки были честными, достойными, людьми, любящими свою Родину, то потомки смогут прожить свои жизни счастливо, в некотором роде пожиная эти плоды. Поэтому в слове „буян“ для бурятов заложен глубокий смысл, и только зная обычаи и культуру региона, можно это понять», — поделилась руководитель Республиканского центра по развитию бурятского языка.

В Год единства народов России познакомиться с самобытной культурой республики помогут не только технологии, но и произведения бурятских писателей, переведенные на русский язык. Оюна Забанова порекомендовала россиянам открыть для себя страницы философской лирики поэтов Дондока Улзытуева, Лопсона Тапхаева, Намжила Нимбуева, Галины Раднаевой, Мэлса Самбуева и других авторов.

Фрагмент из стихотворения «Наказ» поэта Дондока Улзытуева. Читает Оюна Забанова

К слову, внести свой вклад в создание качественного цифрового контента может любой житель страны. Специалисты РЦ «Бэлиг» призывают пользователей отмечать подлинный контент, связанный с Республикой Бурятия, соответствующими хештегами, например, #Бурятия, #Буряадхэлэн, #БурятскийЯзык, #Буряадсоел, #БурятскаяКультура или #БурятскийКостюм. Такая «маркировка» публикаций, фотографий, иллюстраций или постов в соцсетях послужит ценным источником информации для нейросетей. Это позволит им снизить риск генерации ошибок или «галлюцинаций» (вымышленных сведений) в ответ на запросы пользователей.


Светлана Минеева