大语言模型对汉语变体的自动识别 = An evaluation of large language models for identifying Mandarin varieties
尽管所有华语区的汉语源于同一种早期现代汉语,但受不同社会语言环境的影响,逐渐演变出具有地区特色的变体。近三四十年来,汉语变体研究已取得诸多成果,但大语言模型处理不同汉语变体的能力仍有待考证。因此,本研究以四个汉语变体(中国大陆普通话、新加坡华语、香港国语以及台湾国语)的词汇为对象,考察了当前主流大语言模型处理汉语变体的能力。 本研究分为两大部分:(1)大语言模型对汉语变体的识别能力、以及(2)大语言模型对不同汉语变体词汇的理解和生成能力。通过对搜集的数据进行进一步的分析与讨论后,本研究发现:(1)大语言模型有将某汉语变体识别为另一汉语变体的倾向,尤其是将新加坡华语识别为中国大陆普通话;(2)...
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Final Year Project |
Language: | Chinese |
Published: |
Nanyang Technological University
2025
|
Subjects: | |
Online Access: | https://hdl.handle.net/10356/183019 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Nanyang Technological University |
Language: | Chinese |