- Номер
- Журнал СФУ. Гуманитарные науки. 2025 18 (10)
- Авторы
- Епимахова, А. С.; Коканова, Е. С.
- Контактная информация
- Епимахова, А. С.: Северный (Арктический) федеральный университет имени М. В. Ломоносова Российская Федерация, Архангельск; Коканова, Е. С.: Северный (Арктический) федеральный университет имени М. В. Ломоносова Российская Федерация, Архангельск
- Ключевые слова
- Tundra Nenets language; low-resource language; digital resources; parallel corpus; тундровый ненецкий язык; малоресурсный язык; цифровые ресурсы; параллельный корпус
- Аннотация
Развитие информационных технологий привело к пониманию, что разные языки имеют разное количество данных, в результате чего появились понятия «малоресурсный» и «многоресурсный» язык, отражающие присутствие языков в цифровой среде, наличие инструментов обработки естественного языка. Цель настоящей статьи – исследование ненецких ресурсов, выявленных при сборе параллельного корпуса тундрового ненецкого языка (лесной ненецкий язык классифицируется как отдельный язык). Анализ показывает, что в онлайн-среде данные становятся более разнообразными, так как на ненецкий переводятся законодательные и религиозные тексты, создаются публицистические тексты. Оригинальные ненецкие тексты относятся к художественному типу текстов, однако в двуязычной публикации не всегда можно определить язык оригинала и язык перевода. Ненецко-русский онлайн-словарь является первым цифровым сервисом для этого языка в России. В настоящее время для ненецкого языка еще не существует библиотек обработки естественного языка, и их создание зависит от сбора, структурирования и разметки данных, что требует сотрудничества компьютерных лингвистов и носителей языка
- Страницы
- 1924–1931
- EDN
- AJZMDG
- Статья в архиве электронных ресурсов СФУ
- https://elib.sfu-kras.ru/handle/2311/157509
Эта работа лицензируется по лицензии Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0).