- Номер
- Журнал СФУ. Гуманитарные науки. 2016 9 (4)
- Авторы
- Грегори, Иан; Аткинсон, Пол; Харди, Эндрю; Жулен-Джей, Амелия; Кершоу, Дэниел; Портер, Кэтрин; Рейсон, Пол; Рапп, Си Джей
- Контактная информация
- Грегори, Иан:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Аткинсон, Пол:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Харди, Эндрю:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Жулен-Джей, Амелия:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Кершоу, Дэниел:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Портер, Кэтрин:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Рейсон, Пол:Университет Ланкастера Ланкастер LA1 4YT Великобритания; Рапп, Си Джей:Университет Ланкастера Ланкастер LA1 4YT Великобритания
- Ключевые слова
- Corpora; GIS; Resource enhancement; Research Methods; OCR quality; корпуса данных; GIS; увеличение ресурсов; методы исследования; качество распознавания сканированных данных
- Аннотация
В последнее время становится все очевиднее, что цифровые гуманитарные науки чрезмерно ориентированы на создание новых данных, в то время как их главным приоритетом должно быть использование цифровых ресурсов для обогащения знаний. Хотя это звучит относительно просто, для достижения данной цели необходимо провести исследования промежуточной стадии для расширения цифровых ресурсов, развития новых методов и изучения их потенциала для получения новых знаний из имеющихся ресурсов. И хотя эта стадия исследования уже известна в области социальных наук, гуманитарные науки знакомы с ней в меньшей степени. Данная работа представляет собой изучение такой промежуточной стадии на примере исследования коллекции газет XIX века Британской библиотеки – корпуса текста объемом в несколько миллиардов слов, который предоставляет собой ценный материал о жизни XIX века, но в силу своего объема и сложной структуры является неудобным в обращении
- Страницы
- 994-1006
- Статья в архиве электронных ресурсов СФУ
- https://elib.sfu-kras.ru/handle/2311/20211
Эта работа лицензируется по лицензии Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0).