Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama

Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi taksonomi biologi ini ‘dipinjam’ oleh saintis dan j...

Full description

Saved in:
Bibliographic Details
Main Authors: Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki, Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2018
Online Access:http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf
http://journalarticle.ukm.my/13779/
http://ejournal.ukm.my/gema/issue/view/1087
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universiti Kebangsaan Malaysia
Language: English
id my-ukm.journal.13779
record_format eprints
spelling my-ukm.journal.137792019-12-09T23:24:55Z http://journalarticle.ukm.my/13779/ Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama Mohd Zakree Ahmad Nazri, Kurniawan, Tri Basuki Abdul Razak Hamdan, Salwani Abdullah, Mohammed Azlan Mis, Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi taksonomi biologi ini ‘dipinjam’ oleh saintis dan jurutera Internet dalam membangunkan taksonomi untuk Internet. Seperti taksonomi biologi, membangunkan taksonomi untuk Internet secara manual bukanlah suatu yang mudah dan murah. Tugas ini mengambil masa dan memerlukan kepintaran dalam bidang. Justeru saintis komputer telah menggunakan pendekatan kecerdasan buatan untuk membangunkan taksonomi secara automatik dari teks. Algoritma pembelajaran mesin dicipta untuk membolehkan mesin ‘membaca’ teks dan kemudiannya ‘belajar’ untuk membina taksonomi dari konteks yang diperolehi dari teks. Objektif utama kajian ini adalah untuk membangunkan algoritma pembelajaran taksonomi dari Bahasa Melayu yang lebih berkesan dari algoritma sedia ada menggunakan kaedah penghibridan. Makalah ini menyiasat keberkesanan algoritma hibrid antara Algoritma Kunang-Kunang (AKK) dengan Algoritma K-Min Pembahagi Dua Sama (PDS) yang dipanggil Algoritma Kunang-Kunang Pembahagi Dua Sama (AKK-PD). Kajian empirikal ini mengumpul data dari eksperimen yang dijalankan ke atas tiga teks Bahasa Melayu dari bidang Fekah, Biokimia dan Teknologi Maklumat. Perbandingan data ketepatan berasaskan ukuran-F menunjukkan algoritma hybrid AKK-PD membina taksonomi yang lebih tepat berbanding menggunakan algoritma sedia ada. AKK-PD didapati lebih berkesan dan mantap berbanding algoritma bandingan apabila mengendalikan masalah kejarangan data . Walau bagaimanapun, kajian penerokaan ini perlu diteruskan kepada korpus Bahasa Melayu yang lebih besar untuk menguji ketahanan algoritma ini apabila berhadapan dengan korpus yang lebih umum sifatnya berbanding korpus teks yang teknikal dan menjurus kepada suatu bidang sahaja. Teknik pengekstrakan ciri berasakan kebergantungan sintaksis juga perlu dipertingkatkan kerana jelas teknik telah menghasilkan konteks yang mengalami masalah kejarangan data yang serius. Justeru memberi cabaran baharu untuk penyelidikan pembelajaran taksonomi dari teks Melayu. Penerbit Universiti Kebangsaan Malaysia 2018-05 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf Mohd Zakree Ahmad Nazri, and Kurniawan, Tri Basuki and Abdul Razak Hamdan, and Salwani Abdullah, and Mohammed Azlan Mis, (2018) Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama. GEMA: Online Journal of Language Studies, 18 (2). pp. 182-201. ISSN 1675-8021 http://ejournal.ukm.my/gema/issue/view/1087
institution Universiti Kebangsaan Malaysia
building Tun Sri Lanang Library
collection Institutional Repository
continent Asia
country Malaysia
content_provider Universiti Kebangsaan Malaysia
content_source UKM Journal Article Repository
url_provider http://journalarticle.ukm.my/
language English
description Taksonomi digunakan untuk menerangkan bahawa haiwan boleh dikelaskan kepada beberapa kategori seperti mamalia, reptilia dan buaya. Taksonomi biologi ini membolehkan persamaan, perbezaan malah hubungan antara haiwan ditakrifkan. Konsep dan fungsi taksonomi biologi ini ‘dipinjam’ oleh saintis dan jurutera Internet dalam membangunkan taksonomi untuk Internet. Seperti taksonomi biologi, membangunkan taksonomi untuk Internet secara manual bukanlah suatu yang mudah dan murah. Tugas ini mengambil masa dan memerlukan kepintaran dalam bidang. Justeru saintis komputer telah menggunakan pendekatan kecerdasan buatan untuk membangunkan taksonomi secara automatik dari teks. Algoritma pembelajaran mesin dicipta untuk membolehkan mesin ‘membaca’ teks dan kemudiannya ‘belajar’ untuk membina taksonomi dari konteks yang diperolehi dari teks. Objektif utama kajian ini adalah untuk membangunkan algoritma pembelajaran taksonomi dari Bahasa Melayu yang lebih berkesan dari algoritma sedia ada menggunakan kaedah penghibridan. Makalah ini menyiasat keberkesanan algoritma hibrid antara Algoritma Kunang-Kunang (AKK) dengan Algoritma K-Min Pembahagi Dua Sama (PDS) yang dipanggil Algoritma Kunang-Kunang Pembahagi Dua Sama (AKK-PD). Kajian empirikal ini mengumpul data dari eksperimen yang dijalankan ke atas tiga teks Bahasa Melayu dari bidang Fekah, Biokimia dan Teknologi Maklumat. Perbandingan data ketepatan berasaskan ukuran-F menunjukkan algoritma hybrid AKK-PD membina taksonomi yang lebih tepat berbanding menggunakan algoritma sedia ada. AKK-PD didapati lebih berkesan dan mantap berbanding algoritma bandingan apabila mengendalikan masalah kejarangan data . Walau bagaimanapun, kajian penerokaan ini perlu diteruskan kepada korpus Bahasa Melayu yang lebih besar untuk menguji ketahanan algoritma ini apabila berhadapan dengan korpus yang lebih umum sifatnya berbanding korpus teks yang teknikal dan menjurus kepada suatu bidang sahaja. Teknik pengekstrakan ciri berasakan kebergantungan sintaksis juga perlu dipertingkatkan kerana jelas teknik telah menghasilkan konteks yang mengalami masalah kejarangan data yang serius. Justeru memberi cabaran baharu untuk penyelidikan pembelajaran taksonomi dari teks Melayu.
format Article
author Mohd Zakree Ahmad Nazri,
Kurniawan, Tri Basuki
Abdul Razak Hamdan,
Salwani Abdullah,
Mohammed Azlan Mis,
spellingShingle Mohd Zakree Ahmad Nazri,
Kurniawan, Tri Basuki
Abdul Razak Hamdan,
Salwani Abdullah,
Mohammed Azlan Mis,
Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
author_facet Mohd Zakree Ahmad Nazri,
Kurniawan, Tri Basuki
Abdul Razak Hamdan,
Salwani Abdullah,
Mohammed Azlan Mis,
author_sort Mohd Zakree Ahmad Nazri,
title Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
title_short Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
title_full Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
title_fullStr Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
title_full_unstemmed Pembangunan taksonomi dari teks Melayu menggunakan algoritma kunang-kunang pembahagi dua sama
title_sort pembangunan taksonomi dari teks melayu menggunakan algoritma kunang-kunang pembahagi dua sama
publisher Penerbit Universiti Kebangsaan Malaysia
publishDate 2018
url http://journalarticle.ukm.my/13779/1/25314-76342-2-PB.pdf
http://journalarticle.ukm.my/13779/
http://ejournal.ukm.my/gema/issue/view/1087
_version_ 1654961129158344704