Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.mslu.by/handle/edoc/13460
Название: Программный комплекс для генерации динамического корпуса текстов СМИ
Другие названия: Software Package for Generating a Dynamic Media Texts Corpus
Авторы: Степанова, Д. В.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Вычислительная лингвистика
Дата публикации: 2023
Издатель: Минский государственный лингвистический университет
Библиографическое описание: Степанова, Д. В. Программный комплекс для генерации динамического корпуса текстов СМИ / Д. В. Степанова // Вестник МГЛУ. Сер. 1, Филология. – 2023. – № 6 (127). – С. 123–130.
Аннотация: Статья посвящена проблеме создания динамического лингвистического корпуса точными методами в автоматизированном режиме. Рассматриваются возможность и эффективность использования современных программных инструментов для генерации репрезентативного размеченного корпуса текстов СМИ. Написанные на языке программирования Python коды с применением библиотеки обработки естественного языка spaCy позволили разработать процедуру накопления базы данных корпуса и получить количественные и качественные параметры по заданным запросам. Ключевые слова: корпусная лингвистика; динамический лингвистический корпус; корпусный менеджер; база данных; обработка естественного языка.
Описание: Stepanova D. Software Package for Generating a Dynamic Media Texts Corpus. The article deals with the problem of dynamic linguistic corpus automated creation based on precise methods. The article examines the possibility and efficiency of using modern software tools generating a representative tagged corpus of media texts. The developed Python library programs based on the spaCy natural language processing allow the author of the article to develop the procedure of creating and maintaining a database and to obtain quantitative and qualitative parameters for specified queries. Key words: corpus linguistics; dynamic linguistic corpus; corpus manager; database; natural language processing.
URI: http://e-lib.mslu.by/handle/edoc/13460
ISSN: 1819-7620
Располагается в коллекциях:Вестник МГЛУ. Сер. 1. Филология (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
123-130.pdf522,51 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.