Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.mslu.by/handle/edoc/9338
Название: Стандартизированная процедура получения статистических параметров текста (на материале цикла рассказов Дж. Лондона «Смок Белью. Смок и Малыш»)
Другие названия: Standardized Procedure for Obtaining Statistical Parameters of a Text (on the material of the stories by J. London “Smoke Bellew. Smoke and Shorty”)
Авторы: Горожанов, А. И.
Гусейнова, И. А.
Степанова, Д. В.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Дата публикации: 2022
Издатель: Минский государственный лингвистический университет
Библиографическое описание: Вестник МГЛУ. Сер. 1, Филология. – Минск : МГЛУ, 2022. – № 4 (119). – С. 7-13.
Аннотация: Статья посвящена проблеме интерпретации художественного произведения точными методами. Рассматривается возможность и эффективность использования современных программных инструментов для определения статистических параметров аутентичных текстов. Написанные на языке программирования Python коды с применением библиотеки обработки естественного языка spaCy позволили разработать процедуру нормализации текста и получить количественные данные о заданных параметрах текста для анализа его содержания. Ключевые слова: нормализация текста; токен; библиотека spaCy; идиостиль; статистические параметры текста; программный код.
Описание: Gorozhanov A. I., Guseinova I. A., Stepanova D. V. Standardized Procedure for Obtaining Statistical Parameters of a Text (on the material of the stories by J. London “Smoke Bellew. Smoke and Shorty”). The article deals with the problem of application of precise methods of linguistic research to fiction interpretation. The article examines the possibility and efficiency of using modern software tools to determine the statistical parameters of the unmarked original fictional texts. The developed Python library programs based on the spaCy natural language processing allow the authors of the article to develop the procedure of text normalization and to obtain the frequencies of the given text parameters to analyze its content. Key words: text normalization; token; spaCy library; ideostyle; statistical parameters of the text; programming code.
URI: http://e-lib.mslu.by/handle/edoc/9338
ISSN: 1819-7620
Располагается в коллекциях:Вестник МГЛУ. Сер. 1. Филология (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
Горожанов А. И., Гусейнова И. А., Степанова Д. В. Стандартизированная.pdf691,61 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.