Применение машинного обучения для автоматического извлечения метафор

Донина, О. В.

Please use this identifier to cite or link to this item: http://e-lib.mslu.by/handle/edoc/15729

Title:	Применение машинного обучения для автоматического извлечения метафор
Other Titles:	Applying machine learning for automatic metaphor extraction
Authors:	Донина, О. В.
Keywords:	Языкознание (лингвистика) Прикладное языкознание
Issue Date:	2024
Publisher:	Минский государственный лингвистический университет
Citation:	Донина, О. В. Применение машинного обучения для автоматического извлечения метафор / О. В. Донина // Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : сб. науч. ст. по итогам междунар. науч. конф., Минск, 23-24 окт. 2024 г. / редкол.: Н. Е. Лаптева (отв. ред.) [и др.]. – Минск : МГЛУ, 2024. – С. 522–527.
Abstract:	Данное исследование направлено на оценку эффективности нейронных сетей для задач бинарной классификации текста, в частности, для выявления наличия метафоры в предложениях. Для проведения сравнительного анализа были разработаны и протестированы шесть классификаторов, половина из которых основывалась на классических моделях машинного обучения (наивный байесовский классификатор, логистическая регрессия, метод опорных векторов), а другая половина – на нейросетевых архитектурах (рекуррентная нейронная сеть, сверточная нейронная сеть, глубокая нейронная сеть). В качестве датасета для обучения и тестирования классификаторов был использован корпус размеченных вручную примеров метафорической сочетаемости, содержащий 166 765 предложений. Для оценки качества классификации текста использовались такие метрики, как precision, recall, F1-score и accuracy, при этом приоритетной оценкой являлся F1-score. Результаты показали, что нейронные сети демонстрируют значительное преимущество в выявлении метафор в предложениях по сравнению с методами машинного обучения. Особенно выделяется глубокая нейронная сеть (DNN), которая достигает высоких значений precision, recall и F1-score для обоих классов (наличие/отсутствие метафоры). Это может быть связано с ее способностью извлекать сложные зависимости из данных и строить более глубокие иерархические представления. Также стоит отметить, что метод опорных векторов (SVM) показывает неплохие результаты, хотя его эффективность немного ниже нейронных сетей. Проведение исследований в области автоматической классификации текстов с использованием нейронных сетей открывает дорогу к усовершенствованию способов автоматического извлечения метафор в текстах, что имеет важное значение для задач обработки естественного языка и лингвистического анализа. К л ю ч е в ы е с л о в а: классификация текста; нейронные сети; машинное обучение; Natural Language Processing; автоматическое выявление метафор.
Description:	Donina О. The objective of this study was to assess the efficacy of neural networks in the context of binary text classification tasks, with a particular focus on the detection of metaphors in sentences. A comparative analysis was conducted using six classifiers, with half based on classical machine learning models (naive Bayesian classifier, logistic regression, support vector machine) and the other half on neural network architectures (recurrent neural network, convolutional neural network, deep neural network). A corpus of manually labelled examples of metaphorical combinability containing 166,765 sentences was used as a dataset for training and testing the classifiers. Metrics such as precision, recall, F1-score and accuracy were employed to assess the quality of text classification, with F1-score being the primary metric. The results demonstrated that neural networks exhibited a pronounced advantage in detecting metaphors in sentences relative to machine learning methods. The deep neural network (DNN) in particular exhibited notable performance, achieving high precision, recall and F1-score values for both classes (presence/absence of metaphor). This may be attributed to its capacity to extract intricate interdependencies from data and construct more profound hierarchical representations. It is also noteworthy that the support vector machine (SVM) demonstrates commendable outcomes, although its performance is slightly inferior to that of neural networks. Conducting research in the domain of automatic text classification using neural networks paves the way for the advancement of automated metaphor extraction techniques, which has significant implications for natural language processing and linguistic analysis tasks. K e y w o r d s: text classification; neural networks; machine learning; natural language processing; automatic metaphor detection.
URI:	http://e-lib.mslu.by/handle/edoc/15729
ISBN:	978-985-28-0275-8
Appears in Collections:	Язык в эпоху цифровых трансформаций и развития искусственного интеллекта (статьи)

Files in This Item:

File	Description	Size	Format
522-527.pdf		328,8 kB	Adobe PDF	View/Open

Show full item record

Digital Repository
Of Minsk State Linguistic University

ISSN (online):

Digital RepositoryOf Minsk State Linguistic University

ISSN (online):

Digital Repository
Of Minsk State Linguistic University