2009-06-21 23 views
7

Tôi nghĩ câu hỏi khá đơn giản, tôi có cần tất cả phần còn lại của công cụ trong Unicode sau khi máy bay cơ bản không? Loại công cụ nào được bao gồm và thực sự cần thiết phải không? (và vì mục đích gì?)Tôi có cần máy bay bổ sung không?

Cảm ơn.

Trả lời

10

Nếu bạn dự định bán bất cứ thứ gì ở Trung Quốc, tiêu chuẩn GB 18030 là bắt buộc và yêu cầu ký tự vượt quá BMP (Máy bay đa ngôn ngữ cơ bản). Tiêu chuẩn được thực thi và để bán ở đó, bạn cần phải vượt qua chứng chỉ GB 18030.

Cũng có các tiêu chuẩn quốc gia ở Nhật Bản và Hồng Kông yêu cầu ký tự vượt quá BMP. Ngay cả khi các tiêu chuẩn này không được thi hành như một tiêu chuẩn của Trung Quốc, hỗ trợ chúng có thể mang lại cho bạn một số lợi thế.

Vì vậy, câu trả lời đơn giản là: bạn cần một số nội dung ở đó.

=== 2016 ===

Đó là 7 năm trước. Bây giờ mọi người nói về biểu tượng cảm xúc. Vâng, hầu hết các biểu tượng cảm xúc đều nằm ngoài BMP :-)

+0

Ngoài vấn đề chứng nhận, bộ ký tự Unihan IICore, chứa tất cả các ký tự Hán (Trung Quốc, Nhật Bản, Hàn Quốc) sử dụng hiện đại hiện có chứa 62 ký tự trong Máy bay bổ sung Ideographic (SIP) –

2

Xem complete list of character charts.

Các ký tự bổ sung hiện chứa tập lệnh cổ. Trừ khi bạn có một ứng dụng cần xử lý các tập lệnh cổ như Kharoshthi, Old Persion và Cuneiform, thì có thể không phải là.

Tôi đoán bạn sẽ chỉ phải giải quyết vấn đề này nếu bạn gặp phải thực thi UTF-8 hoặc UTF-16 chưa hoàn thành. Một số triển khai của UTF-8 không hỗ trợ các ký tự 4 byte, đó là mặt phẳng bổ sung: các ký tự trên U + 10000. MySQL đến với tâm trí.

+0

Thực ra tôi đang sử dụng MySQL và đó là lý do tôi yêu cầu. Tôi đã tự hỏi liệu có nên sử dụng các bảng Binary hoặc UTF-8 không. Cảm ơn. – Tower

7

Tùy thuộc vào việc bạn có kiểm soát dữ liệu của mình hay không. Nếu bạn đang sử dụng dữ liệu Unicode từ bất kỳ ai khác ngoài chính mình, bạn thường phải giả định rằng nó có thể bao gồm các ký tự bổ sung, điều này có nghĩa là bạn cần phải xử lý các ký tự thay thế UTF-8, UTF-16 4 byte, v.v.

+1

Câu trả lời hay!Vì vậy, rất ít người chỉ đơn giản là không grok nguyên tắc cơ bản này về nguồn gốc dữ liệu. – hippietrail

2

Bạn nên thử, nếu có thể, để hỗ trợ tất cả Unicode bao gồm cả máy bay bổ sung. Hiện tại có các ngôn ngữ sống đang ngồi trong các mặt phẳng bổ sung như Miao. Các ngôn ngữ sống khác sẽ được thêm vào trong tương lai và một số ngôn ngữ hiện đang cần khu vực sử dụng cá nhân bổ sung. Sau đó, cũng có những gì Mihai Nita nói trong answer của mình.

MySQL, bắt đầu bằng 5,5, cũng supports máy bay bổ sung.

Sẽ tốt hơn nếu bạn dành chút thời gian để hỗ trợ hoàn toàn Unicode để trong tương lai bạn sẽ không gặp vấn đề gì nếu bạn thực sự cần đến nó. Và bạn không biết ai sẽ sử dụng phần mềm của bạn và những tập lệnh nào họ sẽ sử dụng trong tương lai. Bây giờ hầu hết các công cụ dựng hình, bộ công cụ GUI, trình duyệt, hệ điều hành, v.v., sẽ hỗ trợ điều này mà không gặp khó khăn.

Mặc dù câu hỏi này được hỏi vài năm trước, tôi đã xem xét điều này trên một tìm kiếm và mọi thứ đã thay đổi kể từ đó. Tôi hiện đang đối phó với các vấn đề mà các lập trình viên giả định rằng sẽ không có nhu cầu hỗ trợ máy bay bổ sung, hoặc nó vẫn chưa được kiểm chứng.

Các vấn đề liên quan