CRF là một mô hình phân biệt, theo lô, gắn thẻ, trong cùng một gia đình chung với tư cách là mô hình Entropy Markov tối đa.
Giải thích đầy đủ là độ dài sách.
Một lời giải thích ngắn gọn là như sau:
- Con người chú thích 200-500K lời của văn bản, đánh dấu các đối tượng.
- Con người chọn một tập hợp các tính năng mà họ hy vọng cho biết các thực thể. Những thứ như viết hoa hoặc liệu từ đó có được nhìn thấy trong tập huấn luyện bằng thẻ hay không.
- Quy trình đào tạo tính tất cả các lần xuất hiện của các đối tượng địa lý.
- Thịt của thuật toán CRF tìm kiếm không gian của tất cả các mô hình có thể phù hợp với số lượng để tìm số lượng khá tốt.
- Khi chạy, bộ giải mã (có thể là bộ giải mã Viterbi) xem xét một câu và quyết định thẻ nào sẽ gán cho mỗi từ.
Các bộ phận cứng này là lựa chọn tính năng và các thuật toán tìm kiếm trong bước 4.