Đề tài Trích rút mối quan hệ ngữ nghĩa và áp dụng cho hệ thống hỏi đáp tự động Tiếng Việt

Tóm tắt Với sự ra đời và Phát triển ngày càng mạnh mẽ trên World Wide Web đặt ra thách thức đòi hỏi việc khai thác thông tin một cách hiệu quả. Mặc dù chất lượng của các máy tìm kiếm đã được cải thiện nhưng kết quả trả về chỉ là những tài liệu có liên quan. Vì thế, hệ thống hỏi đáp ra đời là một nhu cầu cấp thiết, cung cấp cho người dùng câu trả lời ngắn gọn và chính xác nhất. Đây là một bài toán khó đối với hầu hết các Ngôn ngữ nói chung trên thế giới nói chung cũng như hệ thống tiếng Việt nói riêng. Khoá luận tập trung vào nghiên cứu các phương pháp Xây dựng hệ thống hỏi đáp và đề xuất đề xuất mô hình cho hệ thông hỏi đáp tự động cho tiếng Việt dựa vào phương pháp trích rút Quan hệ ngữ nghĩa bằng cách kết hợp hai phương pháp Snowball của Agichtein, Gravano [1] và phương pháp trích rút mối Quan hệ sử dụng sử máy tìm kiếm của Ravichandran, Hovy [25] cho tập Văn bản tiếng Việt. Thực nghiệm ban đầu của mô hình cho thấy hệ thống có thể trả lời chính xác được 89,1% câu hỏi người dùng đưa vào và khả năng đưa ra câu trả lời là 91,4%. Dựa vào kết quả trên, chúng tôi nhận thấy phương pháp trích rút mối Quan hệ ngữ nghĩa được triển khai cho Ngôn ngữ tiếng Việt là khả quan, phục vụ tốt cho việc Xây dựng hệ thống hỏi đáp. Mục lục Mở đầu 1 Chương 1. Khái quát bài toán trích rút mối Quan hệ ngữ nghĩa . . 3 1.1 Quan hệ ngữ nghĩa . 3 1.2 Các loại Quan hệ ngữ nghĩa . 3 1.3 Bài toán trích rút mối Quan hệ ngữ nghĩa 7 1.4 Hệ thống hỏi đáp dựa trên trích rút Quan hệ ngữ nghĩa . 9 1.4.1 Khái niệm hệ thống hỏi đáp . 9 1.4.2 Một số vấn đề quan tâm khi thiết kế hệ thống hỏi đáp 10 1.4.3 Một số hệ thống hỏi đáp tiêu biểu 10 1.5 Tóm tắt chương một 12 Chương 2. Các phương pháp trích rút mẫu Quan hệ ngữ nghĩa . 13 2.1 Phương pháp DIRPE . 13 2.2 Phương pháp Snowball 16 2.3 Phương pháp trích xuất mẫu tự động sử dụng máy tìm kiếm . 18 2.4 Phương pháp KnowItAll . 19 2.5 Phương pháp TextRunner 22 2.6 Nhận xét . 23 2.7 Tóm tắt chương hai 25 Chương 3. Mô hình hệ thống hỏi đáp tiếng Việt sử dụng trích rút Quan hệ ngữ nghĩa. 26 3.1 Mô hình trích rút mẫu Quan hệ ngữ nghĩa . 26 3.2 Phương pháp sinh tự động thực thể từ tập dữ liệu Web lớn 28 iv 3.3 Mô hình hệ thống hỏi đáp tiếng Việt. 30 3.4 Tổng kết chương ba 33 Chương 4: Thực nghiệm và đánh giá 34 4.1 Môi trường và các công cụ sử dụng cho thực nghiệm 34 4.2 Xây dựng tập dữ liệu . 35 4.3 Thực nghiệm 37 4.3.1 Sinh tự động tập thực thể từ dữ liệu web . 37 4.3.2 Thực nghiệm trích rút mẫu Quan hệ ngữ nghĩa trong Văn bản tiếng Việt 40 4.3.3 Thực nghiệm phân tích câu hỏi và trích xuất câu trả lời cho hệ thống hỏi đáp tiếng Việt sử dụng phương pháp trích rút mối Quan hệ ngữ nghĩa. . 42 Kết luận . 47 Tài liệu tham khảo . 48

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY