Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER
Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCAN...
Saved in:
Main Author: | |
---|---|
Format: | Theses and Dissertations |
Language: | other |
Published: |
Đại học Quốc gia Hà Nội
2016
|
Subjects: | |
Online Access: | http://repository.vnu.edu.vn/handle/VNU_123/8180 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Institution: | Vietnam National University, Hanoi |
Language: | other |
id |
oai:112.137.131.14:VNU_123-8180 |
---|---|
record_format |
dspace |
spelling |
oai:112.137.131.14:VNU_123-81802016-04-13T20:06:22Z Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER Ninh, Thị Thu Hà Xử lý ngôn ngữ Số hóa văn bản FSCANNER Nhận dạng hình ảnh Công nghệ thông tin Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCANNER. Đề xuất chọn chỉ số dpi và góc xoay thích hợp cho ảnh quét để nâng cao hiệu quả nhận dạng OCR. 2016-04-13T03:44:42Z 2016-04-13T03:44:42Z 2014 Thesis 4 tr. http://repository.vnu.edu.vn/handle/VNU_123/8180 other application/pdf Đại học Quốc gia Hà Nội |
institution |
Vietnam National University, Hanoi |
building |
VNU Library & Information Center |
country |
Vietnam |
collection |
VNU Digital Repository |
language |
other |
topic |
Xử lý ngôn ngữ Số hóa văn bản FSCANNER Nhận dạng hình ảnh Công nghệ thông tin |
spellingShingle |
Xử lý ngôn ngữ Số hóa văn bản FSCANNER Nhận dạng hình ảnh Công nghệ thông tin Ninh, Thị Thu Hà Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
description |
Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa
góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCANNER. Đề xuất chọn chỉ số dpi và góc xoay thích hợp cho ảnh quét để nâng cao hiệu quả nhận
dạng OCR. |
format |
Theses and Dissertations |
author |
Ninh, Thị Thu Hà |
author_facet |
Ninh, Thị Thu Hà |
author_sort |
Ninh, Thị Thu Hà |
title |
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
title_short |
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
title_full |
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
title_fullStr |
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
title_full_unstemmed |
Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER |
title_sort |
các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng việt của hệ thống fscanner |
publisher |
Đại học Quốc gia Hà Nội |
publishDate |
2016 |
url |
http://repository.vnu.edu.vn/handle/VNU_123/8180 |
_version_ |
1680966267316469760 |