Please use this identifier to cite or link to this item:
http://e-lib.mslu.by/handle/edoc/15737
Title: | Нейросети как инструмент анализа текста: сравнительный аспект |
Other Titles: | Neural network as a tool of text analysis: comparative study |
Authors: | Овсянникова, М. А. Николаева, М. Н. |
Keywords: | Языкознание (лингвистика) Прикладное языкознание Японский язык |
Issue Date: | 2024 |
Publisher: | Минский государственный лингвистический университет |
Citation: | Овсянникова, М. А. Нейросети как инструмент анализа текста: сравнительный аспект / М. А. Овсянникова, М. Н. Николаева // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам междунар. науч. конф., Минск, 23-24 окт. 2024 г. / редкол.: Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : МГЛУ, 2024. – С. 570–575. |
Abstract: | Данная статья представляет собой сравнительный анализ применения традиционных методов исследования языкового материала и использования «новейшего» способа обработки текста – нейронной мультимодальной сети. Традиционные методы включают в себя метод сплошной выборки, структурный анализ с целью отбора блендированных языковых единиц из массива материала, а также парсинг сайта исследуемого словаря для упрощения сбора материала. Нейросети, используемые для анализа материала, представлены на бенчмарк-платформе LMSYS Chatbot Arena. Сравнение проходит в несколько этапов: отбор материала «ручным» способом для дальнейшей верификации данных; анализ материала с помощью соответствующего промпта с дальнейшим анализом результатов на наличие галлюцинаций и ошибок. Делается вывод о несовершенстве нейросетей как инструментов анализа текста, однако подчеркивается необходимость использования новых технологий и постепенной модификации работы с ними для расширения инструментария анализа и повышения своих собственных компетенций исследователя. К л ю ч е в ы е с л о в а: нейронная сеть; языковая модель; генеративный предобученный трансформер (GPT); парсинг; словослияние; бленды; анализ текста. |
Description: | Ovsiannikova М., Nikolaeva М. This article is a comparative analysis of traditional methods of studying linguistic material and the use of the "newest" method of text processing, a neural multimodal network. Traditional methods include the continuous sampling method, structural analysis which helps to select blended lexemes from the language material, as well as parsing. The neural networks used to analyze the material are presented on the LMSYS Chatbot Arena benchmark platform. The comparison takes place in several stages: the selection of the material in a “manual” way for further verification of the data; the analysis of the material using the appropriate prompt with further analysis of the results for hallucinations and errors. The article concludes that neural networks are not perfect as text analysis tools but emphasizes the need to use new technologies and gradually enhance the researcher's competencies. K e y w o r d s: neural network; LLM; GPT; parsing; blending; blends; text analysis. |
URI: | http://e-lib.mslu.by/handle/edoc/15737 |
ISBN: | 978-985-28-0275-8 |
Appears in Collections: | Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
570-575.pdf | 339,23 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.