Российские ученые оцифровали эмоции

Российские ученые оцифровали эмоции

Российские ученые оцифровали эмоции
Фото:

Команда разработчиков из «Сколково» в течение года работала над программой, которая способна по звуку человеческого голоса определить, какие эмоциональные тональности содержатся в речи говорящего. Машина уже умеет распознавать пять эмоций – это гнев, грусть, счастье, возбуждение и нейтральная речь.

Сегодня пользователям современных технологий все чаще предлагается управлять устройствами с помощью голоса. С одной стороны, это новый уровень развития роботизированной техники, с другой – удобство эксплуатации для потребителя. Но то, что предлагают российские ученые – вещь абсолютно уникальная: они создали программу, которая оцифровывает эмоции человека посредством голоса.

Как же это работает? Чтобы «научить» программу выделять ту или иную эмоцию, разработчикам необходимы так называемые базы, то есть либо фрагменты живой речи человека, либо специально записанные актерами фразы и предложения с различной эмоциональной окраской. Ученые задают программе определенный алгоритм, и таким образом показывают ей другие эмоции кроме тех, что она уже знает. Машина настраивается на новые параметры и сразу может указывать, какие из набора эмоций испытывает человек в каждый момент речи. Такие комплексы психологических состояний, которые способна узнать программа, могут быть совершенно разными. Главное, по словам разработчиков, иметь базы для «обучения».

Было бы ошибочно полагать, что машина – ученик-отличник. Пока ее точность определения не совершенна, и в чем-то она может ошибаться. «Если поставить себе цель определить, например, пять эмоций, то обычный человек имеет точность примерно в 72%. У нашей программы она чуть больше 60%. И хотя для определения наличия той или иной эмоции этого достаточно, сейчас мы продолжаем улучшать точность, пробуем различные идеи. Но не надо забывать, что много информации об эмоциях содержится в лице человека, в его мимике. И достаточно ли только голоса, чтобы на сто процентов понять эмоцию? Какой есть потолок точности непонятно. Сейчас нам важно довести программу до точности человека или чуть выше», – рассказывает руководитель проекта Павел Приходько. Несмотря на имеющуюся вероятность ошибки, программу уже можно использовать, поскольку она выполняет одну из главных своих задач – в зависимости от цели применения выделить моменты речи, на которые стоит обратить более пристальное внимание. Возможность ошибки зачастую зависит от типа эмоции, которую необходимо выделить. Лучше всего машина научилась распознавать гнев – точность определения более 80%, для грусти точность определения – чуть менее 70%. При такой статистике можно было бы подумать, что проще живому человеку прослушать записи и определить эмоции, чтобы не перепроверять после машины. Однако, во-первых, разработчики в ближайшее время улучшат точность показателей, а, во-вторых, у компьютерной программы есть большое преимущество: если человек не может прослушать 100 часов аудио в короткие сроки, без устали выделяя имеющиеся в записи эмоции, то машина может и делает это очень быстро.

Использовать программу можно как онлайн, то есть отслеживать психологическое состояние говорящего в момент его речи, так и отложено – выявлять эмоции в записанном разговоре. И в том, и в другом случае анализ происходит мгновенно.

В процессе работы над программой выяснилось, что интонационные ноты, соответствующие определенным эмоциям, справедливы не только для русского языка. На уровне европейских языков такое соответствие также устойчиво с малой долей отклонения. Поэтому программа настроена на разных языках, основные из которых – русский и английский.
По словам Павла Приходько, его команда не первая, кто пробует оцифровывать эмоции, но все российские и зарубежные проекты, которые разработчики «Сколково» видели прежде, казались им слабыми. Взяв в качестве прототипов несколько программ и добавив свои идеи, российские ученые работают над собственным проектом. На сегодняшний день он на уровне лучших результатов из того, что уже было сделано в направлении распознавания эмоций посредством голоса.
«Теперь от распознавания хочется перейти к генерации эмоциональной речи, потому что эта задача сейчас вообще никак нормально не решена. То есть все голосовые системы говорят нейтральным языком.», – делится планами на будущее Павел.

Как говорят разработчики проекта, программой оцифровки эмоций уже заинтересовались различные организации, где важной составляющей является телефонное общение. Это различные психологические службы помощи, банки, call-центры. Не исключено, что в дальнейшем программа будет неотъемлемой частью и в работе спецслужб.

Анастасия Красновская, Москва
Специально для «Социнформбюро»

Читать volgasib.ru в