Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi taksonomi biologi ini ‘dipinjam’ oleh saintis dan j...
Saved in:
Main Authors: | , , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Penerbit Universiti Kebangsaan Malaysia
2018
|
Online Access: | http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf http://journalarticle.ukm.my/13779/ http://ejournal.ukm.my/gema/issue/view/1087 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universiti Kebangsaan Malaysia |
Language: | English |
id |
my-ukm.journal.13779 |
---|---|
record_format |
eprints |
spelling |
my-ukm.journal.137792019-12-09T23:24:55Z http://journalarticle.ukm.my/13779/ Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis, Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi taksonomi biologi ini ‘dipinjam’ oleh saintis dan jurutera Internet dalam membangunkan taksonomi untuk Internet. Seperti taksonomi biologi, membangunkan taksonomi untuk Internet secara manual bukanlah suatu yang mudah dan murah. Tugas ini mengambil masa dan memerlukan kepintaran dalam bidang. Justeru saintis komputer telah menggunakan pendekatan kecerdasan buatan untuk membangunkan taksonomi secara automatik dari teks. Algoritma pembelajaran mesin dicipta untuk membolehkan mesin ‘membaca’ teks dan kemudiannya ‘belajar’ untuk membina taksonomi dari konteks yang diperolehi dari teks. Objektif utama kajian ini adalah untuk membangunkan algoritma pembelajaran taksonomi dari Bahasa Melayu yang lebih berkesan dari algoritma sedia ada menggunakan kaedah penghibridan. Makalah ini menyiasat keberkesanan algoritma hibrid antara Algoritma Kunang-Kunang (AKK) dengan Algoritma K-Min Pembahagi Dua Sama (PDS) yang dipanggil Algoritma Kunang-Kunang Pembahagi Dua Sama (AKK-PD). Kajian empirikal ini mengumpul data dari eksperimen yang dijalankan ke atas tiga teks Bahasa Melayu dari bidang Fekah, Biokimia dan Teknologi Maklumat. Perbandingan data ketepatan berasaskan ukuran-F menunjukkan algoritma hybrid AKK-PD membina taksonomi yang lebih tepat berbanding menggunakan algoritma sedia ada. AKK-PD didapati lebih berkesan dan mantap berbanding algoritma bandingan apabila mengendalikan masalah kejarangan data . Walau bagaimanapun, kajian penerokaan ini perlu diteruskan kepada korpus Bahasa Melayu yang lebih besar untuk menguji ketahanan algoritma ini apabila berhadapan dengan korpus yang lebih umum sifatnya berbanding korpus teks yang teknikal dan menjurus kepada suatu bidang sahaja. Teknik pengekstrakan ciri berasakan kebergantungan sintaksis juga perlu dipertingkatkan kerana jelas teknik telah menghasilkan konteks yang mengalami masalah kejarangan data yang serius. Justeru memberi cabaran baharu untuk penyelidikan pembelajaran taksonomi dari teks Melayu. Penerbit Universiti Kebangsaan Malaysia 2018-05 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf Mohd Zakree Ahmad Nazri, and Kurniawan, Tri Basuki and Abdul Razak Hamdan, and Salwani Abdullah, and Mohammed Azlan Mis, (2018) Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama. GEMA: Online Journal of Language Studies, 18 (2). pp. 182-201. ISSN 1675-8021 http://ejournal.ukm.my/gema/issue/view/1087 |
institution |
Universiti Kebangsaan Malaysia |
building |
Tun Sri Lanang Library |
collection |
Institutional Repository |
continent |
Asia |
country |
Malaysia |
content_provider |
Universiti Kebangsaan Malaysia |
content_source |
UKM Journal Article Repository |
url_provider |
http://journalarticle.ukm.my/ |
language |
English |
description |
Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa
kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan
persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi
taksonomi biologi ini ‘dipinjam’ oleh saintis dan jurutera Internet dalam membangunkan
taksonomi untuk Internet. Seperti taksonomi biologi, membangunkan taksonomi untuk
Internet secara manual bukanlah suatu yang mudah dan murah. Tugas ini mengambil masa
dan memerlukan kepintaran dalam bidang. Justeru saintis komputer telah menggunakan
pendekatan kecerdasan buatan untuk membangunkan taksonomi secara automatik dari teks.
Algoritma pembelajaran mesin dicipta untuk membolehkan mesin ‘membaca’ teks dan
kemudiannya ‘belajar’ untuk membina taksonomi dari konteks yang diperolehi dari teks.
Objektif utama kajian ini adalah untuk membangunkan algoritma pembelajaran taksonomi
dari Bahasa Melayu yang lebih berkesan dari algoritma sedia ada menggunakan kaedah
penghibridan. Makalah ini menyiasat keberkesanan algoritma hibrid antara Algoritma
Kunang-Kunang (AKK) dengan Algoritma K-Min Pembahagi Dua Sama (PDS) yang
dipanggil Algoritma Kunang-Kunang Pembahagi Dua Sama (AKK-PD). Kajian empirikal ini
mengumpul data dari eksperimen yang dijalankan ke atas tiga teks Bahasa Melayu dari
bidang Fekah, Biokimia dan Teknologi Maklumat. Perbandingan data ketepatan berasaskan
ukuran-F menunjukkan algoritma hybrid AKK-PD membina taksonomi yang lebih tepat
berbanding menggunakan algoritma sedia ada. AKK-PD didapati lebih berkesan dan mantap
berbanding algoritma bandingan apabila mengendalikan masalah kejarangan data . Walau
bagaimanapun, kajian penerokaan ini perlu diteruskan kepada korpus Bahasa Melayu yang
lebih besar untuk menguji ketahanan algoritma ini apabila berhadapan dengan korpus yang lebih umum sifatnya berbanding korpus teks yang teknikal dan menjurus kepada suatu bidang
sahaja. Teknik pengekstrakan ciri berasakan kebergantungan sintaksis juga perlu
dipertingkatkan kerana jelas teknik telah menghasilkan konteks yang mengalami masalah
kejarangan data yang serius. Justeru memberi cabaran baharu untuk penyelidikan
pembelajaran taksonomi dari teks Melayu. |
format |
Article |
author |
Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis, |
spellingShingle |
Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis, Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
author_facet |
Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis, |
author_sort |
Mohd Zakree Ahmad Nazri, |
title |
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
title_short |
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
title_full |
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
title_fullStr |
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
title_full_unstemmed |
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
title_sort |
pembangunan taksonomi dari teks melayu menggunakan algoritma kunang-kunang pembahagi dua sama |
publisher |
Penerbit Universiti Kebangsaan Malaysia |
publishDate |
2018 |
url |
http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf http://journalarticle.ukm.my/13779/ http://ejournal.ukm.my/gema/issue/view/1087 |
_version_ |
1654961129158344704 |