Tôi nghĩ rằng đó là phần lớn lịch sử, nhưng có một sự khác biệt rõ ràng. Trang mã là bảng tra cứu, một byte cụ thể ánh xạ tới một ký tự cụ thể. Các trang mã khác nhau sử dụng các ánh xạ khác nhau. Trong những ngày xa xưa, những ánh xạ đó không thực sự được thực hiện. Mà yêu cầu bạn cũng có phông chữ có glyphs để phù hợp với trang mã. Vẫn còn một vấn đề ngày hôm nay btw, giao diện điều khiển các cửa sổ có một trang mã.
Không có ánh xạ trong mã hóa Unicode. Họ chỉ cần nén 32 bit thành định dạng hiệu quả. Các mã hóa Unicode khác nhau sử dụng các cách khác nhau để siết chặt các bit. Nhân vật luôn có một giá trị cố định (codepoint trong Unicode nói).
Tệp văn bản được mã hóa UTF phải có BOM, cho phép người đọc tự động phát hiện mã hóa. Không có quy ước nào tồn tại cho các tệp văn bản được mã hóa bằng trang mã. Nhận được văn bản tốt trong số họ là một chút của một crap shoot. Đó là một điều xấu nên chết rồi :)
Nguồn
2010-08-25 21:04:44
+1 Cảm ơn bạn đã liên kết bài viết! –