Câu hỏi của tôi liên quan đến dự án tôi vừa bắt đầu làm việc và đó là ChatBot.Đặt vé xem phim với ChatBot
Bot tôi muốn xây dựng có nhiệm vụ khá đơn giản. Nó phải tự động hóa quá trình mua vé xem phim. Đây là miền khá gần và bot có tất cả quyền truy cập cần thiết vào cơ sở dữ liệu điện ảnh. Tất nhiên nó là okay cho bot để trả lời như "Tôi không biết" nếu tin nhắn người dùng không liên quan đến quá trình đặt vé xem phim.
Tôi đã tạo bản trình diễn đơn giản chỉ để hiển thị cho một vài người và xem họ có quan tâm đến một sản phẩm như vậy hay không. Bản demo sử dụng phương pháp DFA đơn giản và một số văn bản dễ dàng khớp với gốc. Tôi đã tấn công nó trong một ngày và hóa ra người dùng đã rất ấn tượng rằng họ có thể đặt mua vé thành công mà họ muốn. (Bản demo sử dụng kết nối tới cơ sở dữ liệu điện ảnh để cung cấp cho người dùng tất cả thông tin cần thiết để đặt mua vé mà họ mong muốn).
Mục tiêu hiện tại của tôi là tạo phiên bản tiếp theo, phiên bản nâng cao hơn, đặc biệt là về hiểu biết ngôn ngữ tự nhiên. Ví dụ: phiên bản demo yêu cầu người dùng chỉ cung cấp một thông tin trong một tin nhắn duy nhất và không công nhận liệu họ có cung cấp thêm thông tin có liên quan (tiêu đề phim và thời gian chẳng hạn) hay không. Tôi đọc rằng một kỹ thuật hữu ích ở đây được gọi là "Ngữ nghĩa khung và khe", và nó có vẻ hứa hẹn, nhưng tôi đã không tìm thấy bất kỳ chi tiết nào về cách sử dụng phương pháp này.
Hơn nữa, tôi không biết phương pháp nào là tốt nhất để cải thiện Hiểu ngôn ngữ tự nhiên. Đối với hầu hết các phần, tôi xem xét:
- Sử dụng kỹ thuật NLP "chuẩn" để hiểu rõ hơn về thông điệp người dùng. Ví dụ, cơ sở dữ liệu đồng nghĩa, sửa lỗi chính tả, một phần của thẻ lời nói, đào tạo một số phân loại dựa trên thống kê để nắm bắt các điểm tương đồng và quan hệ khác giữa các từ (hoặc giữa toàn bộ câu nếu có thể?), V.v.
- Sử dụng AIML để lập mô hình luồng hội thoại . Tôi không chắc liệu bạn có nên sử dụng AIML trong miền đóng như vậy hay không. Tôi chưa bao giờ sử dụng nó, vì vậy đó là lý do tôi yêu cầu.
- Sử dụng cách tiếp cận "hiện đại" hơn và sử dụng mạng thần kinh để huấn luyện một trình phân loại cho phân loại thư của người dùng. Tuy nhiên, có thể yêu cầu nhiều dữ liệu được dán nhãn
- Bất kỳ phương pháp nào khác mà tôi không biết?
Phương pháp nào phù hợp nhất với mục tiêu của tôi?
Bạn có biết nơi tôi có thể tìm thêm tài nguyên về “Chi tiết ngữ nghĩa khung và khe” hoạt động như thế nào? Tôi đang đề cập đến điều này PDF from Stanford khi nói về cách tiếp cận khung và khe.
Bản sao của http://datascience.stackexchange.com/q/12095/8820 –
Nếu có thể, vui lòng sửa đổi câu hỏi thành không dựa trên ý kiến. – Tor