Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://e-lib.mslu.by/handle/edoc/15153
Название: Большие языковые модели в лингвистике
Другие названия: Large language models in linguistics
Авторы: Андренко, К. В.
Ключевые слова: Языкознание (лингвистика)
Прикладное языкознание
Вычислительная лингвистика
Дата публикации: 2024
Издатель: Минский государственный лингвистический университет
Библиографическое описание: Андренко, К. В. Большие языковые модели в лингвистике / К. В. Андренко // Студенческие научные чтения : материалы респуб. конф., Минск, 20 февр. 2024 г. / Минский гос. лингвист. ун-т ; отв. ред. В. Д. Синяк. – Минск : МГЛУ, 2024. – С. 16–18.
Аннотация: Большие данные (BD) преобразуют лингвистику, а большие языковые модели (LLM) становятся важным инструментом лингвистических исследований. LLM, обученные на огромных объемах цифровых текстов, могут обрабатывать и анализировать эти данные таким образом, который не под силу человеку традиционным методами. Они предлагают иной взгляд на язык, выявляя синтаксические и семантические связи в немаркированных наборах данных, и бросают вызов устоявшимся лингвистическим принципам. Однако их использование вызывает этические и научные проблемы, так как их понимание языка в корне отличается от человеческого. Несмотря на эти проблемы, LLM уже используются в лингвистических исследованиях и, как ожидается, помогут нам лучше понять язык. Ключевые слова: большие данные; большая языковая модель; лингвистическое исследование; векторное представление; эмерджентность.
Описание: Andrenko, К. V. Big Data (BD) is transforming linguistics, and Large Language Models (LLM) are becoming an essential tool for linguistic research. LLM, trained on huge volumes of digital texts, can process and analyse this data in ways that traditional methods cannot do for humans. They offer a different perspective on language, revealing syntactic and semantic relationships in unlabelled datasets, and challenge established linguistic principles. However, their use raises ethical and scientific concerns because their understanding of language is fundamentally different from human language. Despite these challenges, LLM are already being used in linguistic research and are expected to help us better understand language. Keywords: Big Data; Large Language Model; linguistic research; vector representation; emergence.
URI: http://e-lib.mslu.by/handle/edoc/15153
ISBN: 978-985-28-0255-0
Располагается в коллекциях:Студенческие научные чтения : материалы респуб. конф., Минск, 20 февраля 2024 г. (статьи)

Файлы этого ресурса:
Файл Описание РазмерФормат 
16-18.pdf164,62 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.