Журнал СФУ. Математика и физика / Определение темы для маршрутизации вызовов на естественном языке на основе коллективов методов взвешивания термов

Полный текст (.pdf)
Номер
Журнал СФУ. Математика и физика. 2016 9 (2)
Авторы
Сергиенко, Роман Б.; Шан, Мухаммад; Минкер, Вольфганг; Семенкин, Евгений С.
Контактная информация
Сергиенко, Роман Б.:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия; Шан, Мухаммад:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия; Минкер, Вольфганг:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия; Семенкин, Евгений С.:Институт информатики и телекоммуникаций Сибирский государственный аэрокосмический университет Красноярский рабочий, 31, Красноярск, 660037 Россия
Ключевые слова
natural language call routing; text classification; term weighting; маршрутизация вызовов на естественном языке; классификация текста; взвешивание термов
Аннотация

Маршрутизация вызовов на естественном языке – актуальная задача анализа данных, которая может найти применение в различных областях, включая аэрокосмическую индустрию. В ста- тье представлено исследование коллективов методов взвешивания термов для машрутизации вызовов на естественном языке на основе классификации текста. Основная идея предлагаемого подхода заключается в том, что коллективы методов взвешивания термов могу обеспечить по- вышение эффективности классификации при использовании одного и того же алгоритма класси- фикации. Семь различных методов взвешивания термов были протестированы и сравнены между собой с использованием метода ближайших соседей в качестве алгоритма классификации. После этого были сформированы различные комбинации методов взвешивания термов для дальнейшего использования в коллективных решающих правилах. Рассмотрено два подхода для формирования коллективных решающих правил: мета-классификатор на основе индукции правил и голосование простым большинством. Численные исследования показали, что наилучший результат дости- гается при включении всех семи рассматриваемых методов взвешивания термов в коллективное решающее правило на основе голосования простым большинством. Такая комбинация обеспечи- вает статистически значимое улучшение эффективности классификации в сравнении с лучшим по эффективности отедльным методом взвешивания термов

Страницы
235–245
Статья в архиве электронных ресурсов СФУ
https://elib.sfu-kras.ru/handle/2311/20248