SISTEM DETEKSI HOAX BERITA BAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES
Hoax adalah suatu tindakan untuk tujuan menipu. Hoax secara asal kata berasal dari gabungan kata hocus to trick yang artinya yaitu cara untuk menipu. Masalah yang ada pada saat ini yaitu semakin cepatnya penyebaran berita hoax khususnya berita berbahasa Indonesia oleh karena itu dibutuhkannya sis...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations NonPeerReviewed |
Language: | Indonesian Indonesian |
Published: |
2018
|
Subjects: | |
Online Access: | http://repository.unair.ac.id/77851/1/ST%20SI%2033-18%20SAN%20S%20-%20ABSTRAK.pdf http://repository.unair.ac.id/77851/2/ST%20SI%2033-18%20SAN%20S%20-%20FULLTEXT.pdf http://repository.unair.ac.id/77851/ http://www.lib.unair.ac.id |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universitas Airlangga |
Language: | Indonesian Indonesian |
Summary: | Hoax adalah suatu tindakan untuk tujuan menipu. Hoax secara asal kata berasal
dari gabungan kata hocus to trick yang artinya yaitu cara untuk menipu. Masalah yang
ada pada saat ini yaitu semakin cepatnya penyebaran berita hoax khususnya berita
berbahasa Indonesia oleh karena itu dibutuhkannya sistem untuk mendeteksi kategori
berita (hoax atau fakta). Perancangan dan pengembangan sistem deteksi hoax dengan
menggunakan BING web search API sebagai query expansion, menggunakan
algoritma tala sebagai stemming, menggunakan algoritma cosine similarity sebagai
menghitung kemiripan antar dokumen dan menggunakan algoritma naïve bayes untuk
klasifikasi pada berita yang dianalisa.
Data yang digunakan pada sistem ini menggunakan perbandingan 70:30 dengan
jumlah data training sebanyak 250 berita dan jumlah data testing sebanyak 108 berita.
Penelitian ini membandingkan nilai precision, recall dan f measure pada berita uji
dengan kondisi menggunakan url dan tanpa mneggunakan url. Serta pada masingmasing
kondisi tersebut akan diuji dengan variasi threshold nilai similarity, yaitu 0.2,
0.4 dan 0.6 untuk menemukan kondisi dan threshold nilai similarity terbaik.
Berdasarkan uji coba sistem, menghasilkan kondisi terbaik yaitu kondisi berita
menggukan url pada threshold nilai similarity 0.2 dengan nilai precision sebesar 0.91,
nilai recall sebesar 1 dan nilai f measure sebesar 0.95 dan pada nilai similarity yang
sama, yaitu 0.2 namun tanpa menggunakan url menghasilkan nilai precision sebesar
0.88, nilai recall sebesar 1 dan nilai f measure sebesar 0.94. |
---|