Метод московских исследователей позволит использовать искусственный интеллект для автоматического анализа литературных произведений. Система может определить тип персонажей по репликам и описанию, а также раскрыть характер их взаимоотношений, сообщили ТАСС в пресс-службе Института искусственного интеллекта AIRI.
«Содержащийся в исследовании набор шагов можно использовать для извлечения именованных сущностей и их взаимосвязей из других текстов. С помощью описанных методов можно выполнять ряд практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком», — говорится в сообщении.
Группа исследователей под руководством старшего научного сотрудника Института искусственного интеллекта AIRI Ильи Макарова приспособила уже существующие нейросетевые алгоритмы для литературного анализа текстов, а также распознавания персонажей и определения характера их взаимоотношений. Для этого ученые применили теорию графов и так называемые NER-алгоритмы, одну из форм компьютерной обработки естественного языка.
Специалисты проверили работу подхода на «Властелине колец» и других произведениях Джона Рональда Руэла Толкина. После обучения система искусственного интеллекта успешно распознала то, в каких отношениях находились свыше 880 наименованных сущностей в книгах британского писателя, а также научилась узнавать их по репликам.
Аналогичным образом, как отмечают ученые, можно анализировать любые сложные и объемные литературные произведения, другие типы текстов, в том числе имеющие важное историческое или юридическое значение. Это позволит использовать системы искусственного интеллекта для подготовки кратких изложений подобных документов, а также глубокого анализа правовых норм.
Источник: ТАСС.