PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED

Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk...

Full description

Saved in:
Bibliographic Details
Main Author: NAZILATUL MAHBUBAH, 081211631005
Format: Theses and Dissertations NonPeerReviewed
Language:Indonesian
Indonesian
Published: 2016
Subjects:
Online Access:http://repository.unair.ac.id/62614/1/ST.SI.19.17%20.%20Mah.p%20-%20ABSTRAK.pdf
http://repository.unair.ac.id/62614/2/ST.SI.19.17%20.%20Mah.p%20-%20SEC.pdf
http://repository.unair.ac.id/62614/
http://lib.unair.ac.id
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universitas Airlangga
Language: Indonesian
Indonesian
Description
Summary:Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja. Untuk menghasilkan sebuah ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut.Metode yang digunakan untuk menghitung bobot kalimat dalam penelitian ini adalah Metode Centroid-based.Tahap dalam system ini untuk meghasilkan sebuah ringkasan adalah melakukan preprocessing terhadap dokumen-dokumen, menghitung bobot kalimat menggunakan metode centroid-based, dan pemilihan ringkasan menggunakan kombinasi tiga parameter. Dokumen sampel yang digunakan berupa 100 artikel berita online yang didapatkan ari situs detik.com. Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga evaluator. Evaluatoradalah orang-orang yang bekerja pada bidang broadcasting.Dari proses tersebut akan menghasilkan nilai F-Measure yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi yang dilakukan adalah dengan membandingkan hasil ringkasan yang dihasilkan dengan hasil ringkasan yang dihasilkan oleh fitur Auto Summarize Ms Word 2007. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measure sebesar0,47 yang lebih tinggi dari fitur Auto Summarize Ms Word 2007 dengan nilai 0,30.