大语言模型对汉语变体的自动识别 = An evaluation of large language models for identifying Mandarin varieties

尽管所有华语区的汉语源于同一种早期现代汉语,但受不同社会语言环境的影响,逐渐演变出具有地区特色的变体。近三四十年来,汉语变体研究已取得诸多成果,但大语言模型处理不同汉语变体的能力仍有待考证。因此,本研究以四个汉语变体(中国大陆普通话、新加坡华语、香港国语以及台湾国语)的词汇为对象,考察了当前主流大语言模型处理汉语变体的能力。 本研究分为两大部分:(1)大语言模型对汉语变体的识别能力、以及(2)大语言模型对不同汉语变体词汇的理解和生成能力。通过对搜集的数据进行进一步的分析与讨论后,本研究发现:(1)大语言模型有将某汉语变体识别为另一汉语变体的倾向,尤其是将新加坡华语识别为中国大陆普通话;(2)...

Full description

Saved in:
Bibliographic Details
Main Author: 方乔 Fang, Qiao
Other Authors: Lin Jingxia
Format: Final Year Project
Language:Chinese
Published: Nanyang Technological University 2025
Subjects:
Online Access:https://hdl.handle.net/10356/183019
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Nanyang Technological University
Language: Chinese