Как определить настроение текста

Предыдущая статья Следующая статья

Профессор МГУ Наталья Валентиновна Лукашевич рассказала о том, как искусственный интеллект распознает тональность текста

Аудитория В4 Шуваловского корпуса МГУ имени М. В. Ломоносова 8 октября стала эпицентром презентации научных исследований в сфере искусственного интеллекта, которые прошли в рамках Всероссийского фестиваля НАУКА 0+. Наблюдениями поделилась и ведущий научный сотрудник Научно-исследовательского вычислительного центра МГУ имени М. В. Ломоносова, доктор технических наук, профессор Наталья Валентиновна Лукашевич.

©Полина Соколова / Журналист Online

В своей лекции Наталья Валентиновна пояснила, что тональность – это отношение некоторого лица к теме текста или каким-то ее аспектам. Основной задачей метода распознания тональности является классификация текста по его настроению на позитивные, негативные и нейтральные.

Лектор также обозначила, что распознание тональности текста помогает решать трудности в разных сферах жизни общества - анализировать отзывы пользователей о товарах и услугах, осуществлять мониторинг репутации бренда или компании, а также анализировать настроение населения по социально-политическим вопросам.

Однако в такой работе искусственного интеллекта возникают проблемы. Главная из них, по словам Натальи Валентиновны, состоит в том, что оценочные слова в нашей лексике не передают разнообразие выражения и интонаций. Искусственному интеллекту трудно понять, какая оценка является эксплицитной (явной), а какая – имплицитной (запутанной, не проявляющейся явно). Оценочная лексика многозначна. Например, слово «пресный» может и обозначать «неинтересный», и употребляться в словосочетании «пресная вода». Также тональность зависит от предметной области. Наталья Валентиновна привела пример слова «смешной». Оно часто позитивно в индустрии кинематографа, но скорее негативно в политике.

Кроме того, основной проблемой является использование иронии и сарказма, которое порой трудно распознать и самому человеку. Обычно по словам коннотация выглядит положительно, но, на самом деле, она отрицательна. Лектор привела пример из новостных заголовков: «Сбербанк – самая крупная сеть неработающих банкоматов в России». Искусственному интеллекту очень трудно определить, что это ирония, так как анализируется каждое отдельное слово.

Наталья Валентиновна поделилась и подходами к анализу тональности. Первые из них – лингвистико-инженерные. Они включают составление словарей, правил. Однако весь поток информации очень трудно зафиксировать в такой форме. Еще одни подходы основаны на машинном обучении – нейронных методах нахождения закономерностей, выделения признаков сообщений. При таком методе возникает сложность – необходима ручная разметка, что, конечно, снижает качество работы.

Лектор еще обратила внимание, что при тестировании по анализу тональности твитов на русском языке ошиблись почти все системы. Но разработки в этой сфере продолжаются. Большой прогресс в извлечении тональности достигнут на основе модели BERT, которая была предобучена на больших объемах текстовых данных. 

21.07.2021
«Корейцы любят наш типаж!»
Модели Светлана Истомина, Элиз Чуприс и Анастасия Соловьёва поделились c "Журналистом Online" впечатлениями о работе в Южной Корее
21.01.2023
Кино глазами зрителей
Режиссер Сергей Тютин рассказал о культовом фильме Билли Уайлдера «Бульвар Сансет»
23.10.2019
Маркетинговое мышление в художественной литературе
На Фестивале NAUKA 0+ рассказали об использовании приемов маркетинга в искусстве
20.04.2021
«Кто хочет быть вечно молодым?»
Ведущий научный сотрудник МГУ имени М.В. Ломоносова Максим Скулачев рассказал об исследованиях лекарства от старения