KLASTERISASI DAN GEOVISUALISASI TWEET DENGAN ALGORITMA K-MEANS UNTUK KASUS PENYEBARAN PENYAKIT MENULAR LANGSUNG (STUDI KASUS TUBERKULOSIS DAN DIARE)
Berkembangnya media sosial mendorong munculnya situs microblogging seperti Twitter yang dapat berperan sebagai sistem sensor dengan menjadikan penggunanya sebagai sensor dan tweet yang memiliki informasi tentang suatu lokasi. Volume dan kecepatan tweet pada saat suatu kejadian berlangsung sangat tin...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations NonPeerReviewed |
Language: | English English English Indonesian |
Published: |
2019
|
Subjects: | |
Online Access: | http://repository.unair.ac.id/89153/1/ST.SI.33-19%20Alh%20k%20abstrak.pdf http://repository.unair.ac.id/89153/2/ST.SI.33-19%20Alh%20k%20daftar%20isi.pdf http://repository.unair.ac.id/89153/3/ST.SI.33-19%20Alh%20k%20daftar%20pustaka.pdf http://repository.unair.ac.id/89153/4/ST.SI.33-19%20Alh%20k.pdf http://repository.unair.ac.id/89153/ http://lib.unair.ac.id |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universitas Airlangga |
Language: | English English English Indonesian |
Summary: | Berkembangnya media sosial mendorong munculnya situs microblogging seperti Twitter yang dapat berperan sebagai sistem sensor dengan menjadikan penggunanya sebagai sensor dan tweet yang memiliki informasi tentang suatu lokasi. Volume dan kecepatan tweet pada saat suatu kejadian berlangsung sangat tinggi sehingga masyarakat yang terdampak dan petugas profesional mengalami kesulitan dalam pemrosesan informasi. Pada penelitian ini dilakukan klasterisasi tweet dengan algoritma K-Means untuk kasus penyebaran penyakit menular langsung (studi kasus tuberkulosis dan diare). Penelitian ini menggunakan data teks dari media sosial Twitter dengan kata kunci tentang penyebaran penyakit menular langsung (studi kasus tuberkulosis dan diare). Data hasil klasterisasi divisualisasikan untuk menerapkan geovisualisasi tweet. Sebelum proses klasterisasi, dilakukan tahap praproses seperti tokenizing, normalisasi kata, penghapusan stopwords, dan stemming sehingga mengubah data tweet menjadi Term Document Matix (TDM). Proses geovisualisasi dilakukan menggunakan Plotly, sebuah tools analitik dan visualisasi data secara daring. Tahap klasterisasi dengan K-Means pada TDM memperoleh klaster terbaiknya pada klaster dengan jumlah term sebesar 20 dan nilai k sebesar 6 sehingga menghasilkan nilai Sum Squared Error sebesar 7.652,71 dan koefisien silhouette sekitar 0,41. Geovisualisasi dari hasil klasterisasi terkait penyebaran penyakit menular langsung (studi kasus tuberkulosis dan diare) menyebar hampir di seluruh Indonesia. Berdasarkan kemunculan term pada setiap klaster, term terkait diare tersebar pada semua klaster karena memiliki jumlah tweet yang lebih dominan dibandingkan dengan tweet terkait tuberkulosis. |
---|