2010-04-24 19 views

Trả lời

32

Vâng, đó là chính xác. UTF-8 là một bộ mã hóa cho bộ ký tự Unicode, hỗ trợ khá nhiều ngôn ngữ trên thế giới.

Tôi nghĩ sự khác biệt duy nhất đi kèm với sắp xếp kết quả của bạn, các chữ cái khác nhau có thể theo thứ tự khác nhau trong các ngôn ngữ khác (dấu trọng âm, dấu mũ, v.v.). Ngoài ra, so sánh a đến ä có thể hoạt động khác trong một đối chiếu khác.

Hậu tố _ci có nghĩa là sắp xếp và so sánh xảy ra không phân biệt chữ hoa chữ thường.

http://www.collation-charts.org/ có thể bạn quan tâm.

+1

Cảm ơn bạn rất nhiều bạn :) một câu hỏi khác: bạn có nghĩa là nếu tôi chọn utf8_general collation, thì sẽ có vấn đề khi sắp xếp các bản ghi của tôi bằng tiếng Anh và tiếng Ba Tư hoặc các Lang khác? –

+1

tiếng Anh và tiếng Pháp nên sắp xếp khá nhiều như nhau, tôi không biết về những người khác (Ba Tư, arabic, Nhật Bản, Trung Quốc), bởi vì họ không sử dụng các ký tự tiếng Anh bình thường. làm thế nào để bạn thích họ để sắp xếp? sau chữ cái tiếng Anh, inbetween, trước đây? biết ý tôi là gì? – knittl

+0

không, ý tôi là sắp xếp các ký tự ba tư theo cách của nó. nó có nghĩa là cùng một cách như phân loại bảng chữ cái tiếng Anh như A, B, C, ... là nó sẽ làm việc sai với collation này? –

Các vấn đề liên quan