Как определить настроение текста

Предыдущая статья Следующая статья

Профессор МГУ Наталья Валентиновна Лукашевич рассказала о том, как искусственный интеллект распознает тональность текста

Автор:

Полина Соколова

Аудитория В4 Шуваловского корпуса МГУ имени М. В. Ломоносова 8 октября стала эпицентром презентации научных исследований в сфере искусственного интеллекта, которые прошли в рамках Всероссийского фестиваля НАУКА 0+. Наблюдениями поделилась и ведущий научный сотрудник Научно-исследовательского вычислительного центра МГУ имени М. В. Ломоносова, доктор технических наук, профессор Наталья Валентиновна Лукашевич.

©Полина Соколова / Журналист Online

В своей лекции Наталья Валентиновна пояснила, что тональность – это отношение некоторого лица к теме текста или каким-то ее аспектам. Основной задачей метода распознания тональности является классификация текста по его настроению на позитивные, негативные и нейтральные.

Лектор также обозначила, что распознание тональности текста помогает решать трудности в разных сферах жизни общества - анализировать отзывы пользователей о товарах и услугах, осуществлять мониторинг репутации бренда или компании, а также анализировать настроение населения по социально-политическим вопросам.

Однако в такой работе искусственного интеллекта возникают проблемы. Главная из них, по словам Натальи Валентиновны, состоит в том, что оценочные слова в нашей лексике не передают разнообразие выражения и интонаций. Искусственному интеллекту трудно понять, какая оценка является эксплицитной (явной), а какая – имплицитной (запутанной, не проявляющейся явно). Оценочная лексика многозначна. Например, слово «пресный» может и обозначать «неинтересный», и употребляться в словосочетании «пресная вода». Также тональность зависит от предметной области. Наталья Валентиновна привела пример слова «смешной». Оно часто позитивно в индустрии кинематографа, но скорее негативно в политике.

Кроме того, основной проблемой является использование иронии и сарказма, которое порой трудно распознать и самому человеку. Обычно по словам коннотация выглядит положительно, но, на самом деле, она отрицательна. Лектор привела пример из новостных заголовков: «Сбербанк – самая крупная сеть неработающих банкоматов в России». Искусственному интеллекту очень трудно определить, что это ирония, так как анализируется каждое отдельное слово.

Наталья Валентиновна поделилась и подходами к анализу тональности. Первые из них – лингвистико-инженерные. Они включают составление словарей, правил. Однако весь поток информации очень трудно зафиксировать в такой форме. Еще одни подходы основаны на машинном обучении – нейронных методах нахождения закономерностей, выделения признаков сообщений. При таком методе возникает сложность – необходима ручная разметка, что, конечно, снижает качество работы.

Лектор еще обратила внимание, что при тестировании по анализу тональности твитов на русском языке ошиблись почти все системы. Но разработки в этой сфере продолжаются. Большой прогресс в извлечении тональности достигнут на основе модели BERT, которая была предобучена на больших объемах текстовых данных.

12.07.2025

Парфюм как часть культурного кода

В центре "Зотов" открылась выставка "Красная Москва. Женщина в большом городе"

11.07.2024

Дубай в центре Москвы

В Москве прошли Дни культуры Объединенных Арабских Эмиратов

05.07.2026

"Цветы - великие учителя художников"

В Государственной Третьяковской галерее открылась выставка, посвященная флоральным композициям русских живописцев

14.06.2026

"Работать одной командой на страну"

Когда данные встречаются с журналистикой: итоги форума в МИА "Россия Сегодня"