Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER

Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCAN...

Full description

Saved in:
Bibliographic Details
Main Author: Ninh, Thị Thu Hà
Format: Theses and Dissertations
Language:other
Published: Đại học Quốc gia Hà Nội 2016
Subjects:
Online Access:http://repository.vnu.edu.vn/handle/VNU_123/8180
Tags: Add Tag
No Tags, Be the first to tag this record!
Institution: Vietnam National University, Hanoi
Language: other
id oai:112.137.131.14:VNU_123-8180
record_format dspace
spelling oai:112.137.131.14:VNU_123-81802016-04-13T20:06:22Z Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER Ninh, Thị Thu Hà Xử lý ngôn ngữ Số hóa văn bản FSCANNER Nhận dạng hình ảnh Công nghệ thông tin Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCANNER. Đề xuất chọn chỉ số dpi và góc xoay thích hợp cho ảnh quét để nâng cao hiệu quả nhận dạng OCR. 2016-04-13T03:44:42Z 2016-04-13T03:44:42Z 2014 Thesis 4 tr. http://repository.vnu.edu.vn/handle/VNU_123/8180 other application/pdf Đại học Quốc gia Hà Nội
institution Vietnam National University, Hanoi
building VNU Library & Information Center
country Vietnam
collection VNU Digital Repository
language other
topic Xử lý ngôn ngữ
Số hóa văn bản
FSCANNER
Nhận dạng hình ảnh
Công nghệ thông tin
spellingShingle Xử lý ngôn ngữ
Số hóa văn bản
FSCANNER
Nhận dạng hình ảnh
Công nghệ thông tin
Ninh, Thị Thu Hà
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
description Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCANNER. Đề xuất chọn chỉ số dpi và góc xoay thích hợp cho ảnh quét để nâng cao hiệu quả nhận dạng OCR.
format Theses and Dissertations
author Ninh, Thị Thu Hà
author_facet Ninh, Thị Thu Hà
author_sort Ninh, Thị Thu Hà
title Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
title_short Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
title_full Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
title_fullStr Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
title_full_unstemmed Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
title_sort các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng việt của hệ thống fscanner
publisher Đại học Quốc gia Hà Nội
publishDate 2016
url http://repository.vnu.edu.vn/handle/VNU_123/8180
_version_ 1680966267316469760