Как определить настроение текста

Предыдущая статья Следующая статья

Профессор МГУ Наталья Валентиновна Лукашевич рассказала о том, как искусственный интеллект распознает тональность текста

Аудитория В4 Шуваловского корпуса МГУ имени М. В. Ломоносова 8 октября стала эпицентром презентации научных исследований в сфере искусственного интеллекта, которые прошли в рамках Всероссийского фестиваля НАУКА 0+. Наблюдениями поделилась и ведущий научный сотрудник Научно-исследовательского вычислительного центра МГУ имени М. В. Ломоносова, доктор технических наук, профессор Наталья Валентиновна Лукашевич.

©Полина Соколова / Журналист Online

В своей лекции Наталья Валентиновна пояснила, что тональность – это отношение некоторого лица к теме текста или каким-то ее аспектам. Основной задачей метода распознания тональности является классификация текста по его настроению на позитивные, негативные и нейтральные.

Лектор также обозначила, что распознание тональности текста помогает решать трудности в разных сферах жизни общества - анализировать отзывы пользователей о товарах и услугах, осуществлять мониторинг репутации бренда или компании, а также анализировать настроение населения по социально-политическим вопросам.

Однако в такой работе искусственного интеллекта возникают проблемы. Главная из них, по словам Натальи Валентиновны, состоит в том, что оценочные слова в нашей лексике не передают разнообразие выражения и интонаций. Искусственному интеллекту трудно понять, какая оценка является эксплицитной (явной), а какая – имплицитной (запутанной, не проявляющейся явно). Оценочная лексика многозначна. Например, слово «пресный» может и обозначать «неинтересный», и употребляться в словосочетании «пресная вода». Также тональность зависит от предметной области. Наталья Валентиновна привела пример слова «смешной». Оно часто позитивно в индустрии кинематографа, но скорее негативно в политике.

Кроме того, основной проблемой является использование иронии и сарказма, которое порой трудно распознать и самому человеку. Обычно по словам коннотация выглядит положительно, но, на самом деле, она отрицательна. Лектор привела пример из новостных заголовков: «Сбербанк – самая крупная сеть неработающих банкоматов в России». Искусственному интеллекту очень трудно определить, что это ирония, так как анализируется каждое отдельное слово.

Наталья Валентиновна поделилась и подходами к анализу тональности. Первые из них – лингвистико-инженерные. Они включают составление словарей, правил. Однако весь поток информации очень трудно зафиксировать в такой форме. Еще одни подходы основаны на машинном обучении – нейронных методах нахождения закономерностей, выделения признаков сообщений. При таком методе возникает сложность – необходима ручная разметка, что, конечно, снижает качество работы.

Лектор еще обратила внимание, что при тестировании по анализу тональности твитов на русском языке ошиблись почти все системы. Но разработки в этой сфере продолжаются. Большой прогресс в извлечении тональности достигнут на основе модели BERT, которая была предобучена на больших объемах текстовых данных. 

12.07.2022
“А север летом — строгость бок о бок с нежностью”
В Дарвиновском музее проходит фотовыставка Наталии Судец “Краски Севера”
06.12.2022
Интеллектуальная литература для всех
В Москве проходит международная ярмарка интеллектуальной литературы NON/FICTIO№24
28.09.2022
Взгляд изнутри и снаружи
В Музее русского импрессионизма проходит выставка «Точки зрения»
09.12.2021
Как отмечают Новый год в разных странах?
От «Иронии судьбы» и салата оливье до грузинских застольных песен