การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย

วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2546

Saved in:

Bibliographic Details
Main Author:	เกรียงศักดิ์ เหล็กดี
Other Authors:	บุญเสริม กิจศิริกุล
Format:	Theses and Dissertations
Language:	Thai
Published:	จุฬาลงกรณ์มหาวิทยาลัย 2009
Subjects:	ระบบการสร้างภาพเอกสาร การรู้จำอักขระ (คอมพิวเตอร์) ภาษาไทย > ตัวอักษร
Online Access:	http://cuir.car.chula.ac.th/handle/123456789/11059
Tags:	Add Tag No Tags, Be the first to tag this record!
Institution:	Chulalongkorn University
Language:	Thai

id	th-cuir.11059
record_format	dspace
spelling	th-cuir.110592009-09-09T11:54:52Z การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย Document image pre-processing for Thai optical character recognition เกรียงศักดิ์ เหล็กดี บุญเสริม กิจศิริกุล จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ ระบบการสร้างภาพเอกสาร การรู้จำอักขระ (คอมพิวเตอร์) ภาษาไทย -- ตัวอักษร วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2546 พัฒนาโปรแกรมสำหรับการประมวลผลล่วงหน้าของภาพเอกสาร ซึ่งจะประกอบไปด้วยโปรแกรมในการสร้างภาพไบนารีจากภาพเอกสาร ที่ประกอบไปด้วยข้อความ พื้นหลัง หรือภาพถ่าย และโปรแกรมปรับมุมการเอียงของภาพเอกสารโดยอัตโนมัติ งานวิจัยนี้ได้นำเสนอโปรแกรมในการสร้างภาพไบนารีด้วยอัลกอริทึม 2 อัลกอริทึมคือ อัลกอริทึมไนแบล็กหรืออัลกอริทึมของยาโนวิทซ์และบรัคสเตียน และโปรแกรมปรับมุมการเอียงของภาพเอกสารโดยอัตโนมัติอีก 2 อัลกอริทึมคืออัลกอริทึมฮัจทรานสฟอร์มและเนียเรสเนเบอร์คัทเตอริง ข้อมูลภาพเอกสารที่ใช้ทดสอบประกอบด้วยเอกสาร 2 ชุด เอกสารชุดแรกที่ทดลองการไบไรเซชันจะด้วยอัลกอริทึมไนแบล็ก หรืออัลกอริทึมของยาโนวิทซ์และบรัคสเตียน ผลจากการทดลองในการทำไบนาไรเซชันโดยรวม อัลกอริทึมของไนแบล็กจะมีประสิทธิภาพมากกว่า อัลกอริทึมของยาโนวิทซ์และบรัคสเตียน จากภาพเอกสารจำนวน 10 ภาพ มีจำนวนตัวอักษรรวม 2,316 ตัว ผลการรู้จำตัวอักษรเมื่อนำภาพเอกสารที่ผ่านการทำไบนาไรเซชัน ด้วยอัลกอริทึมของอ็อดสึ จำนวนตัวอักษรที่ถูกต้องเท่ากับ 49.32% เอกสารภาพที่ผ่านอัลกอริทึมของไนแบล็ก จำนวนตัวอักษรที่ถูกต้องเท่ากับ 63.16% เอกสารภาพที่ผ่านอัลกอริทึม ของยาโนวิทซ์และบรัคสเตียน จำนวนตัวอักษรที่ถูกต้องเท่ากับ 60.75% ส่วนผลจากการทดลองในการปรับมุมการเอียงโดยอัตโนมัติ ด้วยอัลกอริทึมเนียเรสเนเบอร์คัทเตอริงจะเร็วกว่า และมีความละเอียดมากกว่าอัลกอริทึมฮัจทรานสฟอร์ม โดยที่อัลกอริทึมเนียเรสเนเบอร์คัทเตอริงมีค่าของมุมคลาดเคลื่อน +-0 ํ ถึง +-2 ํ และอัลกอริทึมฮัจทรานสฟอร์มมีค่าของมุมคลาดเคลื่อน คลาดเคลื่อน +-0 ํ ถึง +-3 ํ In this thesis, a set of computer programs for document image pre-processing for Thai optical character recognition are proposed. The binarization program generates binary images from document images composing of text, background, and/or image data. Another program performs automatic skew detection of document images. Niblack's algorithm and Yanowitz and Bruckstein's algorithm were implemented for comparison of binarization. Hough Transform's algorithm and Nearest-Neighbor Clustering's algorithm were implemented for comparison of automatic skew detection. The experimental result of binarization demonstrates that Niblack's algorithm is superior to Yanowitz and Bruckstein's algorithm. The accuracy of OCR after binarization with this algorithm is 63.75% whereas Yanowitz and Bruckstein's algorithm produces accuracy of only 60.75%. For automatic skew detection, Nearest-Neighbor Clustering's algorithm provides higher speed and finer skew correction than Hough Transform's algorithm. 2009-09-09T11:54:52Z 2009-09-09T11:54:52Z 2546 Thesis 9741757808 http://cuir.car.chula.ac.th/handle/123456789/11059 th จุฬาลงกรณ์มหาวิทยาลัย 1953679 bytes application/pdf application/pdf จุฬาลงกรณ์มหาวิทยาลัย
institution	Chulalongkorn University
building	Chulalongkorn University Library
country	Thailand
collection	Chulalongkorn University Intellectual Repository
language	Thai
topic	ระบบการสร้างภาพเอกสาร การรู้จำอักขระ (คอมพิวเตอร์) ภาษาไทย -- ตัวอักษร
spellingShingle	ระบบการสร้างภาพเอกสาร การรู้จำอักขระ (คอมพิวเตอร์) ภาษาไทย -- ตัวอักษร เกรียงศักดิ์ เหล็กดี การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
description	วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2546
author2	บุญเสริม กิจศิริกุล
author_facet	บุญเสริม กิจศิริกุล เกรียงศักดิ์ เหล็กดี
format	Theses and Dissertations
author	เกรียงศักดิ์ เหล็กดี
author_sort	เกรียงศักดิ์ เหล็กดี
title	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
title_short	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
title_full	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
title_fullStr	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
title_full_unstemmed	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
title_sort	การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย
publisher	จุฬาลงกรณ์มหาวิทยาลัย
publishDate	2009
url	http://cuir.car.chula.ac.th/handle/123456789/11059
_version_	1681413742990983168

การประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทย

Similar Items