Please use this identifier to cite or link to this item: http://e-lib.mslu.by/handle/edoc/13460
Title: Программный комплекс для генерации динамического корпуса текстов СМИ
Other Titles: Software Package for Generating a Dynamic Media Texts Corpus
Authors: Степанова, Д. В.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Вычислительная лингвистика
Issue Date: 2023
Publisher: Минский государственный лингвистический университет
Citation: Степанова, Д. В. Программный комплекс для генерации динамического корпуса текстов СМИ / Д. В. Степанова // Вестник МГЛУ. Сер. 1, Филология. – 2023. – № 6 (127). – С. 123–130.
Abstract: Статья посвящена проблеме создания динамического лингвистического корпуса точными методами в автоматизированном режиме. Рассматриваются возможность и эффективность использования современных программных инструментов для генерации репрезентативного размеченного корпуса текстов СМИ. Написанные на языке программирования Python коды с применением библиотеки обработки естественного языка spaCy позволили разработать процедуру накопления базы данных корпуса и получить количественные и качественные параметры по заданным запросам. Ключевые слова: корпусная лингвистика; динамический лингвистический корпус; корпусный менеджер; база данных; обработка естественного языка.
Description: Stepanova D. Software Package for Generating a Dynamic Media Texts Corpus. The article deals with the problem of dynamic linguistic corpus automated creation based on precise methods. The article examines the possibility and efficiency of using modern software tools generating a representative tagged corpus of media texts. The developed Python library programs based on the spaCy natural language processing allow the author of the article to develop the procedure of creating and maintaining a database and to obtain quantitative and qualitative parameters for specified queries. Key words: corpus linguistics; dynamic linguistic corpus; corpus manager; database; natural language processing.
URI: http://e-lib.mslu.by/handle/edoc/13460
ISSN: 1819-7620
Appears in Collections:Вестник МГЛУ. Сер. 1. Филология (статьи)

Files in This Item:
File Description SizeFormat 
123-130.pdf522,51 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.