Журнал СФУ. Гуманитарные науки / Ненецкий язык в цифровом пространстве

Полный текст (.pdf)
Номер
Журнал СФУ. Гуманитарные науки. 2025 18 (10)
Авторы
Епимахова, А. С.; Коканова, Е. С.
Контактная информация
Епимахова, А. С.: Северный (Арктический) федеральный университет имени М. В. Ломоносова Российская Федерация, Архангельск; Коканова, Е. С.: Северный (Арктический) федеральный университет имени М. В. Ломоносова Российская Федерация, Архангельск
Ключевые слова
Tundra Nenets language; low-resource language; digital resources; parallel corpus; тундровый ненецкий язык; малоресурсный язык; цифровые ресурсы; параллельный корпус
Аннотация

Развитие информационных технологий привело к пониманию, что разные языки имеют разное количество данных, в результате чего появились понятия «малоресурсный» и «многоресурсный» язык, отражающие присутствие языков в цифровой среде, наличие инструментов обработки естественного языка. Цель настоящей статьи – исследование ненецких ресурсов, выявленных при сборе параллельного корпуса тундрового ненецкого языка (лесной ненецкий язык классифицируется как отдельный язык). Анализ показывает, что в онлайн-среде данные становятся более разнообразными, так как на ненецкий переводятся законодательные и религиозные тексты, создаются публицистические тексты. Оригинальные ненецкие тексты относятся к художественному типу текстов, однако в двуязычной публикации не всегда можно определить язык оригинала и язык перевода. Ненецко-русский онлайн-словарь является первым цифровым сервисом для этого языка в России. В настоящее время для ненецкого языка еще не существует библиотек обработки естественного языка, и их создание зависит от сбора, структурирования и разметки данных, что требует сотрудничества компьютерных лингвистов и носителей языка

Страницы
1924–1931
EDN
AJZMDG
Статья в архиве электронных ресурсов СФУ
https://elib.sfu-kras.ru/handle/2311/157509

Лицензия Creative Commons Эта работа лицензируется по лицензии Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0).