PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED
Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations NonPeerReviewed |
Language: | Indonesian Indonesian |
Published: |
2016
|
Subjects: | |
Online Access: | http://repository.unair.ac.id/62614/1/ST.SI.19.17%20.%20Mah.p%20-%20ABSTRAK.pdf http://repository.unair.ac.id/62614/2/ST.SI.19.17%20.%20Mah.p%20-%20SEC.pdf http://repository.unair.ac.id/62614/ http://lib.unair.ac.id |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universitas Airlangga |
Language: | Indonesian Indonesian |
Summary: | Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja.
Untuk menghasilkan sebuah ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut.Metode yang digunakan untuk menghitung bobot kalimat dalam penelitian ini adalah Metode Centroid-based.Tahap dalam system ini untuk meghasilkan sebuah ringkasan adalah melakukan preprocessing terhadap dokumen-dokumen, menghitung bobot kalimat menggunakan metode centroid-based, dan pemilihan ringkasan menggunakan kombinasi tiga parameter. Dokumen sampel yang digunakan berupa 100 artikel berita online yang didapatkan ari situs detik.com.
Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga evaluator. Evaluatoradalah orang-orang yang bekerja pada bidang broadcasting.Dari proses tersebut akan menghasilkan nilai F-Measure yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi yang dilakukan adalah dengan membandingkan hasil ringkasan yang dihasilkan dengan hasil ringkasan yang dihasilkan oleh fitur Auto Summarize Ms Word 2007. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measure sebesar0,47 yang lebih tinggi dari fitur Auto Summarize Ms Word 2007 dengan nilai 0,30. |
---|