SISTEM DETEKSI HOAX BERITA BAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA NAÏVE BAYES

Hoax adalah suatu tindakan untuk tujuan menipu. Hoax secara asal kata berasal dari gabungan kata hocus to trick yang artinya yaitu cara untuk menipu. Masalah yang ada pada saat ini yaitu semakin cepatnya penyebaran berita hoax khususnya berita berbahasa Indonesia oleh karena itu dibutuhkannya sis...

Full description

Saved in:
Bibliographic Details
Main Author: KRETAWIWEKA NURAGA SANI, 081411631043
Format: Theses and Dissertations NonPeerReviewed
Language:Indonesian
Indonesian
Published: 2018
Subjects:
Online Access:http://repository.unair.ac.id/77851/1/ST%20SI%2033-18%20SAN%20S%20-%20ABSTRAK.pdf
http://repository.unair.ac.id/77851/2/ST%20SI%2033-18%20SAN%20S%20-%20FULLTEXT.pdf
http://repository.unair.ac.id/77851/
http://www.lib.unair.ac.id
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universitas Airlangga
Language: Indonesian
Indonesian
Description
Summary:Hoax adalah suatu tindakan untuk tujuan menipu. Hoax secara asal kata berasal dari gabungan kata hocus to trick yang artinya yaitu cara untuk menipu. Masalah yang ada pada saat ini yaitu semakin cepatnya penyebaran berita hoax khususnya berita berbahasa Indonesia oleh karena itu dibutuhkannya sistem untuk mendeteksi kategori berita (hoax atau fakta). Perancangan dan pengembangan sistem deteksi hoax dengan menggunakan BING web search API sebagai query expansion, menggunakan algoritma tala sebagai stemming, menggunakan algoritma cosine similarity sebagai menghitung kemiripan antar dokumen dan menggunakan algoritma naïve bayes untuk klasifikasi pada berita yang dianalisa. Data yang digunakan pada sistem ini menggunakan perbandingan 70:30 dengan jumlah data training sebanyak 250 berita dan jumlah data testing sebanyak 108 berita. Penelitian ini membandingkan nilai precision, recall dan f measure pada berita uji dengan kondisi menggunakan url dan tanpa mneggunakan url. Serta pada masingmasing kondisi tersebut akan diuji dengan variasi threshold nilai similarity, yaitu 0.2, 0.4 dan 0.6 untuk menemukan kondisi dan threshold nilai similarity terbaik. Berdasarkan uji coba sistem, menghasilkan kondisi terbaik yaitu kondisi berita menggukan url pada threshold nilai similarity 0.2 dengan nilai precision sebesar 0.91, nilai recall sebesar 1 dan nilai f measure sebesar 0.95 dan pada nilai similarity yang sama, yaitu 0.2 namun tanpa menggunakan url menghasilkan nilai precision sebesar 0.88, nilai recall sebesar 1 dan nilai f measure sebesar 0.94.