Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu
Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Do...
Saved in:
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Penerbit Universiti Kebangsaan Malaysia
2018
|
Online Access: | http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf http://journalarticle.ukm.my/17668/ https://ejournal.ukm.my/gema/issue/view/1146 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universiti Kebangsaan Malaysia |
Language: | English |
id |
my-ukm.journal.17668 |
---|---|
record_format |
eprints |
spelling |
my-ukm.journal.176682021-11-24T05:01:20Z http://journalarticle.ukm.my/17668/ Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu Saidah Saad, Mohamed Kamil Mansor, Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta mikro blog dari rangkaian sosial. Dokumen-dokumen ini amat sukar untuk difahami oleh komputer. Oleh itu, kajian berkaitan pengekstrakan maklumat menjadi sangat penting bagi mengatasi permasalah ini. Salah satu teknik pengekstrakan yang banyak digunakan ialah pengecaman entiti nama. Kajian ini dijalankan bagi mengimplementasikan teknik pengecaman entiti nama dari sumber dokumen berita jenayah bahasa Melayu. Objektif utama kajian ini adalah untuk membangunkan sistem prototaip model pengekstrakan maklumat berita jenayah dalam bahasa Melayu dengan menggunakan teknik pengecaman entiti nama melalui pendekatan berasaskan peraturan. Kajian ini dilakukan dengan mewujudkan korpus berita jenayah dalam bahasa Melayu yang diperolehi dari sumber arkib berita BERNAMA. Korpus ini kemudiannya diteliti secara manual oleh pakar bahasa bagi mengecam entiti nama seperti individu, organisasi, lokasi, tarikh, masa, kewangan, peratusan, jenayah dan senjata. Dalam masa yang sama, sistem prototaip dibangunkan serta diuji dengan korpus yang sama dan hasil dari pengujian ini dibandingkan dengan keputusan pakar. Secara keseluruhannya, ujian sistem prototaip ini menunjukkan hasil yang baik dengan nilai dapatan bagi recall sebanyak 78.67%, manakala bagi precision ialah sebanyak 71.11% dan F-measure sebanyak 74.7%. Hasil dari kajian ini diharap dapat menyumbang kepada pengetahuan mengenai keberkesanan teknik pengecaman entiti nama bagi berita jenayah bahasa Melayu dan seterusnya dapat membantu para penyelidik, polis, peguam serta pihak berkuasa yang terlibat dalam bidang jenayah menyelesaikan jenayah dengan lebih cepat dan berkesan. Penerbit Universiti Kebangsaan Malaysia 2018-11 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf Saidah Saad, and Mohamed Kamil Mansor, (2018) Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu. GEMA: Online Journal of Language Studies, 18 (4). pp. 216-235. ISSN 1675-8021 https://ejournal.ukm.my/gema/issue/view/1146 |
institution |
Universiti Kebangsaan Malaysia |
building |
Tun Sri Lanang Library |
collection |
Institutional Repository |
continent |
Asia |
country |
Malaysia |
content_provider |
Universiti Kebangsaan Malaysia |
content_source |
UKM Journal Article Repository |
url_provider |
http://journalarticle.ukm.my/ |
language |
English |
description |
Pengekstrakan maklumat merupakan satu proses bagi mendapatkan konsep penting dalam
mewakili kandungan teks dari dokumen yang tidak berstruktur. Pada masa kini, terdapat
banyak dokumen yang tidak berstruktur seperti teks berita, artikel blog, forum, tweet serta
mikro blog dari rangkaian sosial. Dokumen-dokumen ini amat sukar untuk difahami oleh
komputer. Oleh itu, kajian berkaitan pengekstrakan maklumat menjadi sangat penting bagi
mengatasi permasalah ini. Salah satu teknik pengekstrakan yang banyak digunakan ialah
pengecaman entiti nama. Kajian ini dijalankan bagi mengimplementasikan teknik
pengecaman entiti nama dari sumber dokumen berita jenayah bahasa Melayu. Objektif utama
kajian ini adalah untuk membangunkan sistem prototaip model pengekstrakan maklumat
berita jenayah dalam bahasa Melayu dengan menggunakan teknik pengecaman entiti nama
melalui pendekatan berasaskan peraturan. Kajian ini dilakukan dengan mewujudkan korpus
berita jenayah dalam bahasa Melayu yang diperolehi dari sumber arkib berita BERNAMA.
Korpus ini kemudiannya diteliti secara manual oleh pakar bahasa bagi mengecam entiti nama
seperti individu, organisasi, lokasi, tarikh, masa, kewangan, peratusan, jenayah dan senjata.
Dalam masa yang sama, sistem prototaip dibangunkan serta diuji dengan korpus yang sama
dan hasil dari pengujian ini dibandingkan dengan keputusan pakar. Secara keseluruhannya,
ujian sistem prototaip ini menunjukkan hasil yang baik dengan nilai dapatan bagi recall
sebanyak 78.67%, manakala bagi precision ialah sebanyak 71.11% dan F-measure sebanyak
74.7%. Hasil dari kajian ini diharap dapat menyumbang kepada pengetahuan mengenai
keberkesanan teknik pengecaman entiti nama bagi berita jenayah bahasa Melayu dan
seterusnya dapat membantu para penyelidik, polis, peguam serta pihak berkuasa yang terlibat
dalam bidang jenayah menyelesaikan jenayah dengan lebih cepat dan berkesan. |
format |
Article |
author |
Saidah Saad, Mohamed Kamil Mansor, |
spellingShingle |
Saidah Saad, Mohamed Kamil Mansor, Pendekatan teknik pengecaman entiti nama bagi capaian berita jenayah bahasa Melayu |
author_facet |
Saidah Saad, Mohamed Kamil Mansor, |
author_sort |
Saidah Saad, |
title |
Pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa Melayu |
title_short |
Pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa Melayu |
title_full |
Pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa Melayu |
title_fullStr |
Pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa Melayu |
title_full_unstemmed |
Pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa Melayu |
title_sort |
pendekatan teknik pengecaman entiti nama bagi capaian berita
jenayah bahasa melayu |
publisher |
Penerbit Universiti Kebangsaan Malaysia |
publishDate |
2018 |
url |
http://journalarticle.ukm.my/17668/1/28999-89239-1-PB.pdf http://journalarticle.ukm.my/17668/ https://ejournal.ukm.my/gema/issue/view/1146 |
_version_ |
1718927143793065984 |