Penjanaan ringkasan isi utama berita bahasa Melayu berdasarkan ciri kata
Teknik ringkasan isi utama merupakan satu proses penyulingan maklumat penting daripada wacana untuk menghasilkan satu ayat tunggal yang mewakili isi utama penulisan. Dalam konteks wacana Bahasa Melayu, kajian bidang ini terlalu sedikit dan tertumpu kepada kaedah penterjemahan mesin. Kajian ini di...
Saved in:
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Penerbit Universiti Kebangsaan Malaysia
2018
|
Online Access: | http://journalarticle.ukm.my/17658/1/28377-89183-1-PB.pdf http://journalarticle.ukm.my/17658/ https://ejournal.ukm.my/gema/issue/view/1146 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universiti Kebangsaan Malaysia |
Language: | English |
Summary: | Teknik ringkasan isi utama merupakan satu proses penyulingan maklumat penting daripada
wacana untuk menghasilkan satu ayat tunggal yang mewakili isi utama penulisan. Dalam
konteks wacana Bahasa Melayu, kajian bidang ini terlalu sedikit dan tertumpu kepada kaedah
penterjemahan mesin. Kajian ini dibahagikan kepada tiga fasa iaitu analisis korpus wacana
berita, pembangunan teknik ringkasan isi utama dan penilaian kualiti hasil ringkasan. Kajian
bertujuan untuk membangunkan teknik ringkasan isi utama dengan menggabungkan kaedah
statistik dan linguistik. Kaedah statistik digunakan untuk menentukan kata signifikan dan
ayat terpenting berdasarkan konsep pemberat. Kaedah linguistik pula digunakan untuk
meningkatkan ketepatannya. Korpus wacana berita Bahasa Melayu terdiri daripada 140
wacana berita berserta ringkasan rujukan tunggal. Hasil analisis korpus wacana berita
mendapati isi utama penulisan berita dapat ditentukan berdasarkan empat ciri iaitu lokasi
kedudukan kata dalam ayat, kedudukan dua ayat pertama wacana berita, kata berjenis
akronim dan kata mewakili nama individu. Kata signifikan dengan isi utama penulisan teks
ditentukan berdasarkan nilai pemberat kata. Nilai ditentukan dengan menggabungkan nilai
frekuensi kata dalam dokumen dan kedudukan kata dalam ayat. Dua ayat pertama dalam
dokumen berita Bahasa Melayu dikenalpasti sebagai calon ayat terbaik bagi pengecaman ayat
terpenting. Hasil penilaian menunjukkan peratus min ketepatan pengecaman ayat terpenting
adalah 82.9% dan min kualiti ringkasan isi utama yang dijanakan masing-masing ialah
kejituan (0.3194), dapatan semula (0.5656), skor-F (0.4012), ROUGE-N (0.5656), ROUGE-L
(0.3392), ROUGE-W (0.1186) dan ROUGE-S (0.1232). Kesimpulannya pertimbangan faktor
bahasa dalam pembangunan teknik ringkasan isi utama mampu menghasilkan ringkasan yang
berkualiti daripada aspek bahasa dan darjah ketepatan yang lebih baik. |
---|