Tôi có một kho tàng của một số 100 nghìn tài liệu pháp lý (chủ yếu là từ Liên minh châu Âu) - luật, bình luận, tài liệu tòa án, v.v. Tôi đang cố gắng làm cho một số ý nghĩa về mặt thuật toán.NLP của nội dung pháp lý?
Tôi đã lập mô hình cho các mối quan hệ đã biết (thời gian, thay đổi này, v.v.). Nhưng ở cấp độ một tài liệu, tôi ước tôi có các công cụ tốt hơn để cho phép hiểu nhanh. Tôi mở cho các ý tưởng, nhưng đây là câu hỏi cụ thể hơn:
Ví dụ: có phương pháp NLP nào để xác định các phần có liên quan/gây tranh cãi của tài liệu trái ngược với bản mẫu không? Các giấy tờ TTIP bị rò rỉ gần đây là hàng ngàn trang với các bảng dữ liệu, nhưng một câu ở đâu đó trong đó có thể phá hủy một ngành công nghiệp.
Tôi đã chơi xung quanh với google mới Parsey McParface
và các giải pháp NLP khác trong quá khứ, nhưng trong khi chúng hoạt động ấn tượng tốt, tôi không chắc họ giỏi cách ly ý nghĩa như thế nào.