2011-12-01 45 views
5

Trong khi điều tra một số tùy chọn bản địa hóa, tôi tình cờ gặp điều này như là một tùy chọn lưu trong Visual Studio. Unicode Codepage 1200 chính xác là gì? Một MSDN page nói:Chính xác Unicode Codepage 1200 là gì?

"Unicode UTF16, ít trật tự endian byte (BMP của tiêu chuẩn ISO 10646); chỉ dành cho các ứng dụng quản lý"

Vậy là Unicode bảng mã 1200 thực sự UTF16 và do đó có một BOM?

Bạn có nên sử dụng tính năng này cho Javascript sau đó không và liệu chúng tôi có phải sử dụng điều này không, đây có phải là tuyên bố bộ ký tự cần thiết trong thẻ tập lệnh không?

Cảm ơn bạn!

+0

Nếu bảng mã chỉ định thứ tự byte làm tài liệu bạn báo cho biết thì BOM không được sử dụng. Nói cách khác, UTF-16 ít endian không được phép có một BOM, theo tiêu chuẩn Unicode. Xem Bảng 2-4: http://www.unicode.org/versions/Unicode6.0.0/ch02.pdf – bames53

+0

Cảm ơn bạn! Tôi nghĩ rằng BOM được đính kèm cho UTF 16, nhưng cuối cùng đã nhận nó xóa ngay bây giờ. – muffin

Trả lời

13

Trang mã 1200 là UTF-16 ít cuối cùng và không hàm ý BOM hay không. Đối với bất cứ điều gì sử dụng web UTF-8 (tất cả mọi thứ: css, html, javascript, vv)

3

Sử dụng UTF-8 cho JavaScript, đừng bận tâm với UTF-16 hoặc bất kỳ biến thể nào của nó (đối với JavaScript, lời khuyên này không áp dụng chung).

+0

Chăm sóc để giải thích -1? –

0

Theo microsoft here, nó có nghĩa như sau:

1200 utf-16 Unicode UTF-16, ít thứ tự byte cuối (BMP của ISO 10646); chỉ có sẵn cho các ứng dụng được quản lý

Tương tự như vậy 1201 là cùng một thứ tự byte lớn nhưng cuối cùng.

1201 unicodeFFFE Unicode UTF-16, thứ tự byte lớn; chỉ có sẵn cho các ứng dụng được quản lý