Perbandingan alat pengekstrakan data teks janaan pengguna

Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini ama...

Full description

Saved in:
Bibliographic Details
Main Authors: Fatimah Rahmat, Zuraihah Ngadengon, Nurul Shakirah Mohd Zawawi
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2020
Online Access:http://journalarticle.ukm.my/14614/1/39062-124033-1-SM.pdf
http://journalarticle.ukm.my/14614/
http://ejournals.ukm.my/ebangi/issue/view/1261
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universiti Kebangsaan Malaysia
Language: English
id my-ukm.journal.14614
record_format eprints
spelling my-ukm.journal.146142020-05-14T06:02:32Z http://journalarticle.ukm.my/14614/ Perbandingan alat pengekstrakan data teks janaan pengguna Fatimah Rahmat, Zuraihah Ngadengon, Nurul Shakirah Mohd Zawawi, Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini amat bernilai sekiranya digunakan untuk tujuan penyelidikan. Namun begitu, bagaimanakah untuk mengekstrak bilangan data teks dalam jumlah yang banyak dengan mudah? Terdapat alat-alat pengesktrakan data teks yang telah dicipta untuk menyelesaikan masalah ini. Malah, banyak kajian terdahulu yang menggunakan data teks sebagai data utama dalam kajiannya tetapi tiada penerangan jelas tentang cara menggunakan alat pengekstrakan data teks tersebut. Oleh itu, kajian ini membincangkan berkenaan lima alat pengesktrakan data teks, ciri-ciri alat pengekstrakan data teks dan perbandingan terhadap 5 alat tersebut. Kajian ini telah melalui fasa penerokaan penting iaitu pemasangan perisian, pengujianan dan hasil output bagi setiap alat tersebut. Hasil kajian ini mendapati bahawa, setiap penggunaan alat pengekstrakan data teks mempunyai ciri istimewa yang tersendiri iaitu jenis perisian, tahap penggunaan, asas pengetahuan pengguna dan jenis laman sesawang yang boleh diekstrak. Selepas melalui proses pengujian bagi setiap alat, kajian ini mendapati bahawa alat pengekstrakan data teks ini sangat memudahkan pengguna untuk mendapatkan data teks dalam kuantiti yang banyak secara sistematik. Oleh itu, semoga kajian ini dimanfaatkan sepenuhnya bagi membolehkan para penyelidik berinteraksi dan berkongsi idea dengan ramai orang serta menjadi rujukan untuk penyelidikan akan datang. Penerbit Universiti Kebangsaan Malaysia 2020 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/14614/1/39062-124033-1-SM.pdf Fatimah Rahmat, and Zuraihah Ngadengon, and Nurul Shakirah Mohd Zawawi, (2020) Perbandingan alat pengekstrakan data teks janaan pengguna. e-BANGI: Jurnal Sains Sosial dan Kemanusiaan, 17 (3). pp. 57-70. ISSN 1823-884x http://ejournals.ukm.my/ebangi/issue/view/1261
institution Universiti Kebangsaan Malaysia
building Tun Sri Lanang Library
collection Institutional Repository
continent Asia
country Malaysia
content_provider Universiti Kebangsaan Malaysia
content_source UKM Journal Article Repository
url_provider http://journalarticle.ukm.my/
language English
description Era Big Data dan perlombongan data telah mewarnai dunia penyelidikan data teks yang dijana pengguna. Peningkatan pengguna media sosial setiap tahun bermaksud pertambahan data dan maklumat yang dijana pengguna memenuhi ruang pelayan di kerangka utama laman sesawang terlibat. Data dan maklumat ini amat bernilai sekiranya digunakan untuk tujuan penyelidikan. Namun begitu, bagaimanakah untuk mengekstrak bilangan data teks dalam jumlah yang banyak dengan mudah? Terdapat alat-alat pengesktrakan data teks yang telah dicipta untuk menyelesaikan masalah ini. Malah, banyak kajian terdahulu yang menggunakan data teks sebagai data utama dalam kajiannya tetapi tiada penerangan jelas tentang cara menggunakan alat pengekstrakan data teks tersebut. Oleh itu, kajian ini membincangkan berkenaan lima alat pengesktrakan data teks, ciri-ciri alat pengekstrakan data teks dan perbandingan terhadap 5 alat tersebut. Kajian ini telah melalui fasa penerokaan penting iaitu pemasangan perisian, pengujianan dan hasil output bagi setiap alat tersebut. Hasil kajian ini mendapati bahawa, setiap penggunaan alat pengekstrakan data teks mempunyai ciri istimewa yang tersendiri iaitu jenis perisian, tahap penggunaan, asas pengetahuan pengguna dan jenis laman sesawang yang boleh diekstrak. Selepas melalui proses pengujian bagi setiap alat, kajian ini mendapati bahawa alat pengekstrakan data teks ini sangat memudahkan pengguna untuk mendapatkan data teks dalam kuantiti yang banyak secara sistematik. Oleh itu, semoga kajian ini dimanfaatkan sepenuhnya bagi membolehkan para penyelidik berinteraksi dan berkongsi idea dengan ramai orang serta menjadi rujukan untuk penyelidikan akan datang.
format Article
author Fatimah Rahmat,
Zuraihah Ngadengon,
Nurul Shakirah Mohd Zawawi,
spellingShingle Fatimah Rahmat,
Zuraihah Ngadengon,
Nurul Shakirah Mohd Zawawi,
Perbandingan alat pengekstrakan data teks janaan pengguna
author_facet Fatimah Rahmat,
Zuraihah Ngadengon,
Nurul Shakirah Mohd Zawawi,
author_sort Fatimah Rahmat,
title Perbandingan alat pengekstrakan data teks janaan pengguna
title_short Perbandingan alat pengekstrakan data teks janaan pengguna
title_full Perbandingan alat pengekstrakan data teks janaan pengguna
title_fullStr Perbandingan alat pengekstrakan data teks janaan pengguna
title_full_unstemmed Perbandingan alat pengekstrakan data teks janaan pengguna
title_sort perbandingan alat pengekstrakan data teks janaan pengguna
publisher Penerbit Universiti Kebangsaan Malaysia
publishDate 2020
url http://journalarticle.ukm.my/14614/1/39062-124033-1-SM.pdf
http://journalarticle.ukm.my/14614/
http://ejournals.ukm.my/ebangi/issue/view/1261
_version_ 1669008490547380224