Please use this identifier to cite or link to this item: http://e-lib.mslu.by/handle/edoc/15153
Title: Большие языковые модели в лингвистике
Other Titles: Large language models in linguistics
Authors: Андренко, К. В.
Keywords: Языкознание (лингвистика)
Прикладное языкознание
Вычислительная лингвистика
Issue Date: 2024
Publisher: Минский государственный лингвистический университет
Citation: Андренко, К. В. Большие языковые модели в лингвистике / К. В. Андренко // Студенческие научные чтения : материалы респуб. конф., Минск, 20 февр. 2024 г. / Минский гос. лингвист. ун-т ; отв. ред. В. Д. Синяк. – Минск : МГЛУ, 2024. – С. 16–18.
Abstract: Большие данные (BD) преобразуют лингвистику, а большие языковые модели (LLM) становятся важным инструментом лингвистических исследований. LLM, обученные на огромных объемах цифровых текстов, могут обрабатывать и анализировать эти данные таким образом, который не под силу человеку традиционным методами. Они предлагают иной взгляд на язык, выявляя синтаксические и семантические связи в немаркированных наборах данных, и бросают вызов устоявшимся лингвистическим принципам. Однако их использование вызывает этические и научные проблемы, так как их понимание языка в корне отличается от человеческого. Несмотря на эти проблемы, LLM уже используются в лингвистических исследованиях и, как ожидается, помогут нам лучше понять язык. Ключевые слова: большие данные; большая языковая модель; лингвистическое исследование; векторное представление; эмерджентность.
Description: Andrenko, К. V. Big Data (BD) is transforming linguistics, and Large Language Models (LLM) are becoming an essential tool for linguistic research. LLM, trained on huge volumes of digital texts, can process and analyse this data in ways that traditional methods cannot do for humans. They offer a different perspective on language, revealing syntactic and semantic relationships in unlabelled datasets, and challenge established linguistic principles. However, their use raises ethical and scientific concerns because their understanding of language is fundamentally different from human language. Despite these challenges, LLM are already being used in linguistic research and are expected to help us better understand language. Keywords: Big Data; Large Language Model; linguistic research; vector representation; emergence.
URI: http://e-lib.mslu.by/handle/edoc/15153
ISBN: 978-985-28-0255-0
Appears in Collections:Студенческие научные чтения : материалы респуб. конф., Минск, 20 февраля 2024 г. (статьи)

Files in This Item:
File Description SizeFormat 
16-18.pdf164,62 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.