Корзина пуста.
Войти

Literary heritage of the 19–20 centuries: classification of raster images for intellectual analysis and thematic modeling of the corpus of handwritten texts

Е.Н. Пенская, Л.В. Хачатурян
80,00 ₽

УДК 82(0.032):004

DOI 10.20339/PhS.5-23.160     

 

Пенская Елена Наумовна,

доктор филологических наук, профессор

Национальный исследовательский университет

«Высшая школа экономики»;

руководитель группы Центра междисциплинарных исследований

Московский физико-технический институт

ORCID: 0000-0003-2469-584X

e-mail: e.penskaya@gmail.com

Хачатурян Любовь Валерьевна,

кандидат культурологии, доцент

Национальный исследовательский университет

«Высшая школа экономики»;

старший научный сотрудник

Центра междисциплинарных исследований

Московский физико-технический институт

ORCID: 0000-0002-2689-5186

e-mail: rgali2010@yandex.ru

 

Рассмотрены современные тенденции работы с цифровыми формами рукописного наследия по истории русской литературы второй половины XIX — середины ХХ в. Проанализирован процесс формирования виртуальных архивов как постепенное накопление big data научных исследований — нераспознанного информационного массива растровых документов, содержащего десятки тысяч цифровых форм архивных документов. Предложены новые подходы к классификации растровых изображений рукописных документов для работы в системах интеллектуального анализа, экспериментальные методы визуализации архивного документа, а также способы использования незадействованных ранее возможностей поискового аппарата. Большое внимание уделено архитектонике рукописи: переходу от графических элементов растрового изображения к семантическим, позволяющим применить элементы интеллектуального анализа данных (data mining) для нераспознанного массива данных.

Ключевые слова: рукописное наследие, цифровая форма, растровое изображение, новые методы, архитектоника рукописи, большие данные, интеллектуальный анализ данных.

 

Литература

1. Моретти Ф. Дальнее чтение / пер. с англ. А. Вдовина, О. Собчука, А. Шели; науч. ред. пер. И. Кушнарева. М.: Изд-во Института Гайдара, 2016. 352 с.

2. Cohen M. The sentimental education of the novel. Princeton: Princeton University Press, 1999. 219 p.

3. Cобрание П.Н. и С.П. Лукницких // РО ИРЛИ РАН. Ф. 754. Оп. 1.

4. Cобрание П.Н. и С.П. Лукницких // Автограф. ХХ век: портал. URL: http://gumilev.literature-archive.ru/ru/digital-archive/stihotvoreniya-i-poemy (01.12.2022).

5. Липкина А.Л., Местецкий Л.М. Классификация букв в изображениях на основе медианного представления // Geometric Modeling. Computer Graphics in Education. 2018. URL: https://www.graphicon.ru/html/2018/papers/362-368.pdf (01.12.2022).

6. Lipkina A., Mestetskiy L. Grapheme approach to recognizing letters based on medial representation // Proceedings of the 14th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications. 2019. Vol. 4. No. 1. P. 351–358.

7. Бородкин Л.И. Digital history: применение цифровых медиа в сохранении культурного наследия? // Методологические проблемы исторической информатики: информационный бюллетень. 2012. Т. 1. № 1. С. 14–21.

8. Бородкин Л.И. Виртуальная реконструкция исторического городского ландшафта: проблемы междисциплинарного синтеза и их решение // Историко-культурное наследие в цифровом измерении: материалы Междунар. науч. конф., г. Пермь, 20–22 октября 2021 г. Пермь, 2021. 210 с. URL: http://www.psu.ru/files/docs/science/books/sborniki/istoriko-kulturnoe-nasledie-v-cifrovom-izmerenii.pdf (01.12.2022).

9. Юмашева Ю.Ю. Методические рекомендации по электронному копированию архивных документов и управлению полученным информационным массивом. М.: ВНИИДАД, 2012. 125 с. URL: https://archives.gov.ru/documents/rekomend_el-copy-archival-documents.shtml (01.12.2022).

10. Богомолов Н.А., Гайдук В.Л. Валерий Брюсов: дневник 1890 г. / предисл. Н.А. Богомолова, подгот. текста и примеч. В.Л. Гайдук и Н.А. Богомолова // Studia Literarum. 2020. Т. 5. № 3. С. 328–357.

11. Объединенный электронный архив Ивана Бунина. URL: http://www.bunin-rgali.ru (01.12.2022).

12. Виртуальный архив Анны Ахматовой. URL: http://www.akhmatova-rgali.ru (01.12.2022).

13. Объединенный архив Вяч. Иванова. URL: http://www.ivanov-rgali.ru/ (01.12.2022).

14. Автограф. ХХ век: электронный архив русской литературы. URL: http://literature-archive.ru (01.12.2022).

15. Объединенный цифровой архив рукописей Ф.М. Достоевского. URL: https://dostoevskyarchive.pushdom.ru/about (01.12.2022).

16. Лавров А. «У нас все — целина: куда ни копни, все впервые» // Arzamas. 2022. 3 августа. URL: https://arzamas.academy/mag/1108-lavrov (01.12.2022).

17. Лавров А.В. Тексты и комментарии: из материалов к истории русской литературы первой трети ХХ века. СПб.: Пушкинский Дом, 2018. 528 с.

18. Гусейнов В.Н. Литературный архив как культурная практика и социальный опыт»: материалы Междунар. науч.-практ. конф. // Вестник Московского университета. Сер. 9: Филология. 2023 (в печати).

19. ISAD (G): основной международный стандарт архивного описания / пер. с англ.; гл. ред. пер. Е.Д. Жабко. 2-е изд. СПб.: Президентская библиотека имени Б.Н. Ельцина, 2011. 247 с.

20. Пильщиков И.А. Семь бесед о филологии и Digital Humanities: интервью и дискуссии (2015–2021). М.: МГУ, 2022. 192 с.

21. Венедиктова Т.Д. Хитроумный путешественник // Новое литературное обозрение. 2018. № 2. С. 82–88.

22. Леонов В.П. Дальнее чтение как стратегия точного библиографоведения // Научные и технические библиотеки. 2019. № 10. С. 56–67.

 

 

Исследование выполнено при финансовой поддержке РНФ (проект № 22-68-00066).