Aplikasi DTMC Untuk Post Proses Pengenalan Citra Dokumen Teks

Pengenalan citra dokumen teks dapat menjadi salah satu cara untuk membantu pelestarian kekayaan budaya dan kesusastraan, misalnya untuk pengenalan citra dokumen teks sastra Jawa yang merupakan salah satu kekayaan kesusastraan di Yogyakarta. Salah satu persoalan yang muncul dalam tahap pengenalan ada...

Full description

Saved in:
Bibliographic Details
Main Authors: Widiarti, Anastasia Rita, Pulungan, Reza
Format: Conference or Workshop Item PeerReviewed
Language:English
Published: 2012
Subjects:
Online Access:https://repository.ugm.ac.id/35121/1/WP-KNSI-12.pdf
https://repository.ugm.ac.id/35121/
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Universitas Gadjah Mada
Language: English
Description
Summary:Pengenalan citra dokumen teks dapat menjadi salah satu cara untuk membantu pelestarian kekayaan budaya dan kesusastraan, misalnya untuk pengenalan citra dokumen teks sastra Jawa yang merupakan salah satu kekayaan kesusastraan di Yogyakarta. Salah satu persoalan yang muncul dalam tahap pengenalan adalah ketidakcocokan hasil pengenalan dokumen, yaitu terdapat kesalahan dalam pengenalan yang disebabkan antara lain karena kualitas dokumen yang sudah berkurang, kualitas scanner maupun kekurangtepatan dalam preprosesing dan pengenalan citra dokumen. Paper ini menyodorkan sebuah gagasan penggunaan discrete-time Markov chain (DTMC) dalam sistem pembangunan matrik suku kata yang dibangun dari kombinasi hasil pengenalan oleh sistem dan pembacaan secara manual. Hasil dari matriks suku kata, yang menyajikan informasi rangkaian suku kata terdekat dari suatu suku kata beserta probabilitas terjadinya rangkaian suku kata yang bersesuaian, akan dapat dipergunakan untuk membantu post proses pengenalan, yaitu untuk menebak suku kata yang seharusnya sehingga menjadi rangkaian dari suku kata yang lain. Dari pengujian dengan sistem pembangun matriks suku kata, yang dilakukan pada dua buah halaman buku sastra Jawa dengan banyak suku kata 587, diperoleh kesimpulan bahwa sistem telah dapat mengenali suku kata dasar dan rangkaian suku kata dasar pembentuk dokumen dengan sangat baik, dengan waktu proses yang relatif sangat cepat.