Please use this identifier to cite or link to this item: http://e-lib.mslu.by/handle/edoc/15653
Title: Корпус текстов как материал для моделирования образа исторической персоналии
Other Titles: Text corpus as a material for modeling the image of a historical personae
Authors: Бекреева, Ю. В.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Вычислительная лингвистика
Белорусский язык
Issue Date: 2024
Publisher: Минский государственный лингвистический университет
Citation: Бекреева, Ю. В. Корпус текстов как материал для моделирования образа исторической персоналии / Ю. В. Бекреева // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам междунар. науч. конф., Минск, 23-24 окт. 2024 г. / редкол.: Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : МГЛУ, 2024. – С. 12–18.
Abstract: В статье представлена процедура отбора и оценки репрезентативности материала исследования из корпусов белорусскоязычных текстов для моделирования образа исторической персоналии. На примере генерации конкорданса по поисковому запросу «Скарына» описаны результаты автоматической выборки эмпирического материала в Белорусском N-корпусе, подкорпусе белорусского языка Национального корпуса русского языка и веб-корпусе beTenTen 2016. Установлены источники и жанры текстов конкордансной выборки; выявлены погрешности поиска, возможности и ограничения автоматической обработки полученного материала инструментами корпуса. Полученные выводы находят практическое применение в проекте создания специализированного корпуса текстов для алгоритмизации моделирования образов исторических персоналий. К л ю ч е в ы е с л о в а: корпус текстов; конкорданс; репрезентативность выборки; образ исторической персоналии; Скарына.
Description: Bekreyeva Y. The article presents a procedure for selecting and assessing the representativeness of research material from corpora of Belarusian-language texts to model the image of a historical personae. The results of automatic sampling of empirical material in the Belarusian N-corpus, the subcorpus of the Belarusian language of the National Corpus of the Russian Language and the beTenTen 2016 web corpus are described on the example of concordance generation for the search query “Скарына”. The sources and genres of texts of the concordance selection are established; search errors, possibilities and limitations of automatic processing of the material using corpus tools are identified.The results and conclusions have practical application in the project of creating a specialized corpus of texts for algorithmizing the modeling of images of historical personae. K e y w o r d s: text corpus; concordance; representativeness of the sample; image of a historical personae; Skaryna.
URI: http://e-lib.mslu.by/handle/edoc/15653
ISBN: 978-985-28-0275-8
Appears in Collections:Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Files in This Item:
File Description SizeFormat 
12-18.pdf755,92 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.