2012-06-10 74 views
8

Tôi có một câu hỏi đơn giản - sự khác biệt giữa UTF-8, UTF-16UTF-32 là gì? Tôi biết rằng các chuỗi được mã hóa có kích thước khác nhau, nhưng UTF-16UTF-32 là gì? Không nên UTF-8 có thể xử lý tất cả các ngôn ngữ chính xác? Và làm thế nào để UTF-7 phù hợp với điều này?Sự khác biệt giữa mã hóa UTF?

EDIT

Ok, tôi khá hiểu những khía cạnh kỹ thuật của toàn bộ điều, nhưng tôi vẫn không thấy một lý do tại sao tôi nên sử dụng ví dụ UTF-16 thay vì UTF-8 trong ứng dụng của tôi. Vì vậy, câu hỏi của tôi là - việc sử dụng thực tế của các mã hóa khác sau đó là UTF-8 là gì?

+1

Tôi chỉ muốn biết một số ví dụ thực tế về UTF-32 giả sử. Nó có ứng dụng thực sự nào không? –

Trả lời

2

Bài viết này bởi Joel nổi tiếng Spolsky giải thích nó perfctly: http://www.joelonsoftware.com/articles/Unicode.html

Trích:

Có hàng trăm mã hóa truyền thống mà chỉ có thể lưu trữ một số điểm mã một cách chính xác và thay đổi tất cả các điểm mã khác vào dấu chấm hỏi. Một số mã hóa tiếng Anh phổ biến là Windows-1252 (chuẩn Windows 9x dành cho ngôn ngữ Tây Âu) và ISO-8859-1, còn gọi là Latin-1 (cũng hữu ích cho bất kỳ ngôn ngữ Tây Âu nào). Nhưng cố gắng lưu trữ các chữ cái tiếng Nga hoặc tiếng Do Thái trong các bảng mã này và bạn nhận được một loạt các dấu hỏi. UTF 7, 8, 16 và 32 đều có thuộc tính tốt đẹp để có thể lưu trữ bất kỳ điểm mã nào chính xác.

Các vấn đề liên quan