大语言模型对汉语变体的自动识别 = An evaluation of large language models for identifying Mandarin varieties

尽管所有华语区的汉语源于同一种早期现代汉语，但受不同社会语言环境的影响，逐渐演变出具有地区特色的变体。近三四十年来，汉语变体研究已取得诸多成果，但大语言模型处理不同汉语变体的能力仍有待考证。因此，本研究以四个汉语变体（中国大陆普通话、新加坡华语、香港国语以及台湾国语）的词汇为对象，考察了当前主流大语言模型处理汉语变体的能力。本研究分为两大部分：（1）大语言模型对汉语变体的识别能力、以及（2）大语言模型对不同汉语变体词汇的理解和生成能力。通过对搜集的数据进行进一步的分析与讨论后，本研究发现：（1）大语言模型有将某汉语变体识别为另一汉语变体的倾向，尤其是将新加坡华语识别为中国大陆普通话；（2）...

Full description

Saved in:

Bibliographic Details
Main Author:	方乔 Fang, Qiao
Other Authors:	Lin Jingxia
Format:	Final Year Project
Language:	Chinese
Published:	Nanyang Technological University 2025
Subjects:	Arts and Humanities 汉语变体词汇差异大语言模型 Varieties of Mandarin Lexical difference Large language model
Online Access:	https://hdl.handle.net/10356/183019
Tags:	Add Tag No Tags, Be the first to tag this record!
Institution:	Nanyang Technological University
Language:	Chinese

Internet

https://hdl.handle.net/10356/183019

大语言模型对汉语变体的自动识别 = An evaluation of large language models for identifying Mandarin varieties

Internet

Similar Items