PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED
Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations NonPeerReviewed |
Language: | Indonesian Indonesian |
Published: |
2016
|
Subjects: | |
Online Access: | http://repository.unair.ac.id/62614/1/ST.SI.19.17%20.%20Mah.p%20-%20ABSTRAK.pdf http://repository.unair.ac.id/62614/2/ST.SI.19.17%20.%20Mah.p%20-%20SEC.pdf http://repository.unair.ac.id/62614/ http://lib.unair.ac.id |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Universitas Airlangga |
Language: | Indonesian Indonesian |
id |
id-langga.62614 |
---|---|
record_format |
dspace |
spelling |
id-langga.626142017-12-27T17:14:36Z http://repository.unair.ac.id/62614/ PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED NAZILATUL MAHBUBAH, 081211631005 T58.6-58.62 Management information systems Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja. Untuk menghasilkan sebuah ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut.Metode yang digunakan untuk menghitung bobot kalimat dalam penelitian ini adalah Metode Centroid-based.Tahap dalam system ini untuk meghasilkan sebuah ringkasan adalah melakukan preprocessing terhadap dokumen-dokumen, menghitung bobot kalimat menggunakan metode centroid-based, dan pemilihan ringkasan menggunakan kombinasi tiga parameter. Dokumen sampel yang digunakan berupa 100 artikel berita online yang didapatkan ari situs detik.com. Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga evaluator. Evaluatoradalah orang-orang yang bekerja pada bidang broadcasting.Dari proses tersebut akan menghasilkan nilai F-Measure yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi yang dilakukan adalah dengan membandingkan hasil ringkasan yang dihasilkan dengan hasil ringkasan yang dihasilkan oleh fitur Auto Summarize Ms Word 2007. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measure sebesar0,47 yang lebih tinggi dari fitur Auto Summarize Ms Word 2007 dengan nilai 0,30. 2016 Thesis NonPeerReviewed text id http://repository.unair.ac.id/62614/1/ST.SI.19.17%20.%20Mah.p%20-%20ABSTRAK.pdf text id http://repository.unair.ac.id/62614/2/ST.SI.19.17%20.%20Mah.p%20-%20SEC.pdf NAZILATUL MAHBUBAH, 081211631005 (2016) PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED. Skripsi thesis, Universitas Airlangga. http://lib.unair.ac.id |
institution |
Universitas Airlangga |
building |
Universitas Airlangga Library |
country |
Indonesia |
collection |
UNAIR Repository |
language |
Indonesian Indonesian |
topic |
T58.6-58.62 Management information systems |
spellingShingle |
T58.6-58.62 Management information systems NAZILATUL MAHBUBAH, 081211631005 PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
description |
Saat ini, Information Retrieval digunakan dalam pengelolaan dokumen di internet dan pengambilan informasi terhadap dokumen-dokumen tersebut. Namun output dari Information Retrieval tidak sepenuhnya sesuai keinginan pengguna. Jika output dokumen sangat banyak, hal ini akan memberatkan pengguna untuk memeriksa dokumen satu per satu. Oleh karena itu diperlukan sistem peringkas teks otomatis (automatic text summarization) yang digunakan untuk meringkas isi dokumen, sehingga pengguna cukup membaca ringkasannya saja.
Untuk menghasilkan sebuah ringkasan dokumen, sistem menghitung bobot tiap kalimat yang merepresentasikan nilai kepentingan kalimat tersebut.Metode yang digunakan untuk menghitung bobot kalimat dalam penelitian ini adalah Metode Centroid-based.Tahap dalam system ini untuk meghasilkan sebuah ringkasan adalah melakukan preprocessing terhadap dokumen-dokumen, menghitung bobot kalimat menggunakan metode centroid-based, dan pemilihan ringkasan menggunakan kombinasi tiga parameter. Dokumen sampel yang digunakan berupa 100 artikel berita online yang didapatkan ari situs detik.com.
Proses evaluasi dilakukan dengan membandingkan ringkasan hasil sistem dengan ringkasan yang dibuat oleh tiga evaluator. Evaluatoradalah orang-orang yang bekerja pada bidang broadcasting.Dari proses tersebut akan menghasilkan nilai F-Measure yang merepresentasikan tingkat keberhasilan sistem dalam menghasilkan ringkasan. Evaluasi yang dilakukan adalah dengan membandingkan hasil ringkasan yang dihasilkan dengan hasil ringkasan yang dihasilkan oleh fitur Auto Summarize Ms Word 2007. Dari penelitian ini diperoleh hasil evaluasi sistem dengan nilai F-Measure sebesar0,47 yang lebih tinggi dari fitur Auto Summarize Ms Word 2007 dengan nilai 0,30. |
format |
Theses and Dissertations NonPeerReviewed |
author |
NAZILATUL MAHBUBAH, 081211631005 |
author_facet |
NAZILATUL MAHBUBAH, 081211631005 |
author_sort |
NAZILATUL MAHBUBAH, 081211631005 |
title |
PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
title_short |
PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
title_full |
PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
title_fullStr |
PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
title_full_unstemmed |
PERINGKAS MULTI-DOKUMEN BAHASA INDONESIA MENGGUNAKAN PENDEKATAN EKSTRAKSI FITUR DENGAN METODE CENTROID-BASED |
title_sort |
peringkas multi-dokumen bahasa indonesia menggunakan pendekatan ekstraksi fitur dengan metode centroid-based |
publishDate |
2016 |
url |
http://repository.unair.ac.id/62614/1/ST.SI.19.17%20.%20Mah.p%20-%20ABSTRAK.pdf http://repository.unair.ac.id/62614/2/ST.SI.19.17%20.%20Mah.p%20-%20SEC.pdf http://repository.unair.ac.id/62614/ http://lib.unair.ac.id |
_version_ |
1681148479047467008 |