Журнал СФУ. Математика и физика / Автоматическое распознавание паралингвистических характеристик говорящего: способы улучшения качества классификации

Полный текст (.pdf)
Номер
Журнал СФУ. Математика и физика. 2015 8 (2)
Авторы
Сидоров, Максим; Шмитт, Александр; Семенкин, Евгений C.
Контактная информация
Сидоров, Максим:; Шмитт, Александр:; Семенкин, Евгений C.:
Ключевые слова
recognition of paralinguistic signals; machine learning algorithms; speaker-adaptive emotion recognition; multimodal approach; распознавание паралингвистических характеристик; алгоритмы машинного обучения; адаптивная процедура распознавания эмоций; мультимодальность
Аннотация

Способность искусственных систем распознавать паралингвистические характеристики говоря- щего, такие как эмоциональное состояние, наличие и степень депрессии, открытость человека, является полезной для широкого круга приложений. Однако производительность таких систем далека от идеальных значений. В этой статье мы предлагаем подходы, применение которых позволяет существенно улучшить производительность систем распознавания. В работе описы- вается метод построения адаптивных эмоциональных моделей, позволяющих использовать ха- рактеристики конкретного человека для построения точных моделей. В статье представлены алгоритмы выявления наиболее значимых характеристик речевых сигналов, позволяющие одно- временно максимизировать точность решения поставленной задачи и минимизировать количе- ство используемых характеристик сигнала. Наконец, предлагается использовать комбинирован- ные аудио визуальные сигналы в качестве входов для алгоритма машинного обучения. Указанные подходы были реализованы и проверены на 9 эмоциональных речевых корпусах. Результаты прове- денных экспериментов позволяют утверждать, что предложенные в статье подходы улучшают качество решения поставленных задач с точки зрения выбранных критериев

Страницы
208–216
Статья в архиве электронных ресурсов СФУ
https://elib.sfu-kras.ru/handle/2311/16808