Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER

Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCAN...

全面介紹

Saved in:
書目詳細資料
主要作者: Ninh, Thị Thu Hà
格式: Theses and Dissertations
語言:other
出版: Đại học Quốc gia Hà Nội 2016
主題:
在線閱讀:http://repository.vnu.edu.vn/handle/VNU_123/8180
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!