Please use this identifier to cite or link to this item: http://e-lib.mslu.by/handle/edoc/9338
Title: Стандартизированная процедура получения статистических параметров текста (на материале цикла рассказов Дж. Лондона «Смок Белью. Смок и Малыш»)
Other Titles: Standardized Procedure for Obtaining Statistical Parameters of a Text (on the material of the stories by J. London “Smoke Bellew. Smoke and Shorty”)
Authors: Горожанов, А. И.
Гусейнова, И. А.
Степанова, Д. В.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Issue Date: 2022
Publisher: Минский государственный лингвистический университет
Citation: Вестник МГЛУ. Сер. 1, Филология. – Минск : МГЛУ, 2022. – № 4 (119). – С. 7-13.
Abstract: Статья посвящена проблеме интерпретации художественного произведения точными методами. Рассматривается возможность и эффективность использования современных программных инструментов для определения статистических параметров аутентичных текстов. Написанные на языке программирования Python коды с применением библиотеки обработки естественного языка spaCy позволили разработать процедуру нормализации текста и получить количественные данные о заданных параметрах текста для анализа его содержания. Ключевые слова: нормализация текста; токен; библиотека spaCy; идиостиль; статистические параметры текста; программный код.
Description: Gorozhanov A. I., Guseinova I. A., Stepanova D. V. Standardized Procedure for Obtaining Statistical Parameters of a Text (on the material of the stories by J. London “Smoke Bellew. Smoke and Shorty”). The article deals with the problem of application of precise methods of linguistic research to fiction interpretation. The article examines the possibility and efficiency of using modern software tools to determine the statistical parameters of the unmarked original fictional texts. The developed Python library programs based on the spaCy natural language processing allow the authors of the article to develop the procedure of text normalization and to obtain the frequencies of the given text parameters to analyze its content. Key words: text normalization; token; spaCy library; ideostyle; statistical parameters of the text; programming code.
URI: http://e-lib.mslu.by/handle/edoc/9338
ISSN: 1819-7620
Appears in Collections:Вестник МГЛУ. Сер. 1. Филология (статьи)



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.