การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์
วิทยานิพนธ์ (อ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2550
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Theses and Dissertations |
Language: | Thai |
Published: |
จุฬาลงกรณ์มหาวิทยาลัย
2014
|
Online Access: | http://cuir.car.chula.ac.th/handle/123456789/41718 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Chulalongkorn University |
Language: | Thai |
id |
th-cuir.41718 |
---|---|
record_format |
dspace |
spelling |
th-cuir.417182018-10-12T07:56:49Z การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ A computational linguistic study of nouns referring to scientific instruments กัญญาณัฐ เกรียงเกตุ สุนันท์ อัญชลีนุกูล กฤษณ์ โกสวัสดิ์ จุฬาลงกรณ์มหาวิทยาลัย. คณะอักษรศาสตร์ วิทยานิพนธ์ (อ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2550 วิทยานิพนธ์เล่มนี้มีวัตถุประสงค์เพื่อศึกษาโครงสร้างระดับตรรกะและความสัมพันธ์ทางความหมายขององค์ประกอบบังคับของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ อันจะนำไปสู่การบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้จากจำนวนองค์ประกอบบังคับ โดยการวิเคราะห์โครงสร้างหลายระดับตามแนว G.E.T.A. ผลการศึกษาพบว่า คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์เกิดจากการประสมคำ โดยมีความสัมพันธ์ไม่ซับซ้อนคิดเป็นร้อยละ 8.98 และความสัมพันธ์ซับซ้อนเป็นลำดับชั้นคิดเป็นร้อยละ91.02 คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์สามารถแบ่งได้เป็น 2 หน่วยสร้าง คือ หน่วยสร้างไร้ศูนย์ (exocentric construction) และหน่วยสร้างเข้าศูนย์ (endocentric construction) คำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ที่เป็นหน่วยสร้างไร้ศูนย์มีลักษณะเป็นคำประสม ประกอบด้วยคำแสดง 2 คำที่ร่วมกันเป็นส่วนหลักเพื่อสื่อความหมายของคำทั้งคำ และผ่านกระบวนการเปรียบเทียบ ส่วนคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ที่เป็นหน่วยสร้างเข้าศูนย์มีทั้งที่เป็นคำประสมและที่ยังคล้ายคลึงนามวลีมาก กรณีหลังนี้พบมากในคำที่ผ่านการแปลในพจนานุกรมไทย – อังกฤษ ประกอบด้วยคำแสดงและองค์ประกอบบังคับอย่างมากที่สุด 2 ตัว โดยคำแสดงทำหน้าที่เป็นส่วนหลัก ส่วนองค์ประกอบบังคับเป็นส่วนขยายจำเป็นเพื่อบ่งชี้คุณสมบัติพิเศษหรือวัตถุประสงค์ เมื่อนำผลการวิเคราะห์ทางภาษาศาสตร์มาประยุกต์กับเครื่องคอมพิวเตอร์ ด้วยโปรแกรม Unitex พบว่า เครื่องคอมพิวเตอร์สามารถบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้ คือ เมื่อทดสอบกับคลังข้อมูลที่เป็นรายการคำศัพท์ ทั้งค่าความครบถ้วน (Recall) และค่าความแม่นยำ (Precision) สูงมาก คือ ประมาณร้อยละ 99 เมื่อทดสอบกับคลังข้อมูลที่เป็นบทความ เครื่องสามารถบอกขอบเขตของคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์ได้ โดยค่าความครบถ้วนอยู่ที่ร้อยละ 71.41 และค่าความแม่นยำอยู่ที่ร้อยละ 30.62 และยังสามารถบอกขอบเขตของคำนามนอกสาขาที่มีโครงสร้างอย่างเดียวกันได้ด้วยอันเป็นผลที่ได้เกินความคาดหมาย โดยค่าความครบถ้วนอยู่ที่ร้อยละ 81.47 และค่าความแม่นยำอยู่ที่ร้อยละ 51.81 This thesis aims to study the logic structure and semantic relations of the arguments of nouns referring to scientific instruments in order to identify the boundary of those words from numbers of arguments by using the multi – level structure analysis proposed by G.E.T.A. All nouns referring to scientific instruments in our lexicon have been compounded from words. They have the 8.98% complex relationship and the 91.02% non-complex relationship. They can be divided into two constructions: exocentric and endocentric. Exocentric construction is the compound word which has two predicates (heads) to express the whole meanings of words. Endocentric construction can be both compound words and noun phrases, which are mostly found in translated words in Thai – English dictionary. It consists of predicate (head) and at most 2 arguments indicating special attributes or purposes. The linguistic results were obtained by testing with Unitex program. It is found that the program can identify the boundary of nouns referring to scientific instruments. When testing with the word list, both recall and precision rates are as high as 99%. On the other hand, when testing with the corpus, the recall rate is 71.41%, and the precision rate is 30.62%. Moreover, the program can even identify the boundary of the nouns in other different fields with 81.47% recall and 51.81% precision rates. 2014-03-23T06:15:55Z 2014-03-23T06:15:55Z 2550 Thesis http://cuir.car.chula.ac.th/handle/123456789/41718 th จุฬาลงกรณ์มหาวิทยาลัย application/pdf application/pdf application/pdf application/pdf application/pdf application/pdf application/pdf application/pdf จุฬาลงกรณ์มหาวิทยาลัย |
institution |
Chulalongkorn University |
building |
Chulalongkorn University Library |
continent |
Asia |
country |
Thailand Thailand |
content_provider |
Chulalongkorn University Library |
collection |
Chulalongkorn University Intellectual Repository |
language |
Thai |
description |
วิทยานิพนธ์ (อ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2550 |
author2 |
สุนันท์ อัญชลีนุกูล |
author_facet |
สุนันท์ อัญชลีนุกูล กัญญาณัฐ เกรียงเกตุ |
format |
Theses and Dissertations |
author |
กัญญาณัฐ เกรียงเกตุ |
spellingShingle |
กัญญาณัฐ เกรียงเกตุ การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
author_sort |
กัญญาณัฐ เกรียงเกตุ |
title |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
title_short |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
title_full |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
title_fullStr |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
title_full_unstemmed |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
title_sort |
การศึกษาคำนามแสดงอุปกรณ์ด้านวิทยาศาสตร์แนวภาษาศาสตร์คอมพิวเตอร์ |
publisher |
จุฬาลงกรณ์มหาวิทยาลัย |
publishDate |
2014 |
url |
http://cuir.car.chula.ac.th/handle/123456789/41718 |
_version_ |
1724630101281210368 |