Как определить настроение текста

Предыдущая статья Следующая статья

Профессор МГУ Наталья Валентиновна Лукашевич рассказала о том, как искусственный интеллект распознает тональность текста

Аудитория В4 Шуваловского корпуса МГУ имени М. В. Ломоносова 8 октября стала эпицентром презентации научных исследований в сфере искусственного интеллекта, которые прошли в рамках Всероссийского фестиваля НАУКА 0+. Наблюдениями поделилась и ведущий научный сотрудник Научно-исследовательского вычислительного центра МГУ имени М. В. Ломоносова, доктор технических наук, профессор Наталья Валентиновна Лукашевич.

©Полина Соколова / Журналист Online

В своей лекции Наталья Валентиновна пояснила, что тональность – это отношение некоторого лица к теме текста или каким-то ее аспектам. Основной задачей метода распознания тональности является классификация текста по его настроению на позитивные, негативные и нейтральные.

Лектор также обозначила, что распознание тональности текста помогает решать трудности в разных сферах жизни общества - анализировать отзывы пользователей о товарах и услугах, осуществлять мониторинг репутации бренда или компании, а также анализировать настроение населения по социально-политическим вопросам.

Однако в такой работе искусственного интеллекта возникают проблемы. Главная из них, по словам Натальи Валентиновны, состоит в том, что оценочные слова в нашей лексике не передают разнообразие выражения и интонаций. Искусственному интеллекту трудно понять, какая оценка является эксплицитной (явной), а какая – имплицитной (запутанной, не проявляющейся явно). Оценочная лексика многозначна. Например, слово «пресный» может и обозначать «неинтересный», и употребляться в словосочетании «пресная вода». Также тональность зависит от предметной области. Наталья Валентиновна привела пример слова «смешной». Оно часто позитивно в индустрии кинематографа, но скорее негативно в политике.

Кроме того, основной проблемой является использование иронии и сарказма, которое порой трудно распознать и самому человеку. Обычно по словам коннотация выглядит положительно, но, на самом деле, она отрицательна. Лектор привела пример из новостных заголовков: «Сбербанк – самая крупная сеть неработающих банкоматов в России». Искусственному интеллекту очень трудно определить, что это ирония, так как анализируется каждое отдельное слово.

Наталья Валентиновна поделилась и подходами к анализу тональности. Первые из них – лингвистико-инженерные. Они включают составление словарей, правил. Однако весь поток информации очень трудно зафиксировать в такой форме. Еще одни подходы основаны на машинном обучении – нейронных методах нахождения закономерностей, выделения признаков сообщений. При таком методе возникает сложность – необходима ручная разметка, что, конечно, снижает качество работы.

Лектор еще обратила внимание, что при тестировании по анализу тональности твитов на русском языке ошиблись почти все системы. Но разработки в этой сфере продолжаются. Большой прогресс в извлечении тональности достигнут на основе модели BERT, которая была предобучена на больших объемах текстовых данных. 

24.07.2020
"Я влюбилась в них сразу же!"
О бально-спортивных танцах «Журналисту Online» рассказала кандидат в мастера спорта Алёна Соболева
07.09.2021
Большой гид по Большому театру
Какие сцены стоит посетить и какие места выбрать
14.10.2024
Лечение виртуальной реальностью и перепрограммированием клеток
Директор Федерального центра мозга и нейротехнологий Всеволод Белоусов рассказал на фестивале науки о возможностях и видах нейротехнологий в современной медицине
19.12.2022
«Тачка цвета кроvи»: о журналистах, которыми мечтают стать дети
В Москве состоялась премьера фильма Мокея Русинова о героях Тольятти