Các kỹ thuật xử lý ngôn ngữ trong số hóa văn bản tiếng Việt của hệ thống FSCANNER

Tìm hiểu các kỹ thuật nhận dạng OCR, kỹ thuật kiểm lỗi chính tả dựa trên mô hình n-gram, kỹ thuật trích rút metadata . Nghiên cứu các đặc trưng lưu trữ và đề xuất xây dựng metadata cho văn bản được số hóa góp phần xác định các thuộc tính cần thiết của metadata cho việc xây dựng hệ thống FSCAN...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Ninh, Thị Thu Hà
التنسيق: Theses and Dissertations
اللغة:other
منشور في: Đại học Quốc gia Hà Nội 2016
الموضوعات:
الوصول للمادة أونلاين:http://repository.vnu.edu.vn/handle/VNU_123/8180
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
المؤسسة: Vietnam National University, Hanoi
اللغة: other