大语言模型对汉语变体的自动识别 = An evaluation of large language models for identifying Mandarin varieties

尽管所有华语区的汉语源于同一种早期现代汉语,但受不同社会语言环境的影响,逐渐演变出具有地区特色的变体。近三四十年来,汉语变体研究已取得诸多成果,但大语言模型处理不同汉语变体的能力仍有待考证。因此,本研究以四个汉语变体(中国大陆普通话、新加坡华语、香港国语以及台湾国语)的词汇为对象,考察了当前主流大语言模型处理汉语变体的能力。 本研究分为两大部分:(1)大语言模型对汉语变体的识别能力、以及(2)大语言模型对不同汉语变体词汇的理解和生成能力。通过对搜集的数据进行进一步的分析与讨论后,本研究发现:(1)大语言模型有将某汉语变体识别为另一汉语变体的倾向,尤其是将新加坡华语识别为中国大陆普通话;(2)...

全面介紹

Saved in:
書目詳細資料
主要作者: 方乔 Fang, Qiao
其他作者: Lin Jingxia
格式: Final Year Project
語言:Chinese
出版: Nanyang Technological University 2025
主題:
在線閱讀:https://hdl.handle.net/10356/183019
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!