2011-10-05 46 views
12

Một số người sẽ trả lời rằng tên miền không phân biệt chữ hoa chữ thường. Trong thế giới Unicode mới, điều này không còn đúng nữa.Tên miền IDN có phân biệt chữ hoa chữ thường không?

(Source)

Tôi nghĩ một trong những bước trong việc chuyển đổi Unicode> Puny là một "bình thường hóa", mà trả lại tên miền chữ thường.

+0

Xem chính thức spec (IETF RFC 4343): [Hệ thống tên miền (DNS) Làm rõ trường hợp không nhạy cảm] (http://tools.ietf.org/html/rfc4343) –

Trả lời

12

Đối với kiểu cũ ASCII dựa trên domain names, Có, tên miền đã và đang tiếp tục phân biệt chữ hoa chữ thường.

Ví dụ, tất cả các đại diện cho cùng một tên miền:

  • example.com
  • Example.com
  • EXAMPLE.COM
  • EXampLE.com

Trong hiện đại DNS, hiện tại chúng tôi có Internationalized Domain Names (IDN) cho phép ký tự Unicode. Vấn đề là việc xác định chữ hoa và chữ thường có thể phức tạp trong một số ngôn ngữ và các bộ ký tự ngoài ASCII (Unicode là một siêu của US-ASCII).

Mục đích của tên miền là phân biệt chữ hoa chữ thường, nhưng có thể có biến chứng với các ký tự cụ thể trong các tập lệnh cụ thể của ngôn ngữ cụ thể của con người. Vì vậy, không có câu trả lời CÓ hoặc KHÔNG đơn giản cho câu hỏi của bạn.

Nếu sử dụng tên miền không phải là ASCII, bạn nên đọc:

-1

URL vẫn không phân biệt chữ hoa chữ thường, ngay cả đối với IDN.

+1

Xem RFC 3987 "Mã định danh tài nguyên quốc tế hóa (IRIs)". Chúng phân biệt chữ hoa chữ thường, nhưng dựa trên sơ đồ cụ thể, chúng có thể phân biệt chữ hoa chữ thường. Phần tên miền của IRI không phân biệt chữ hoa chữ thường, nhưng không phân biệt các phần khác như đường dẫn và tên tệp. – davispuh

+0

Câu hỏi đặt ra là IDN chứ không phải IRI. Một tên miền chỉ là một phần của IRI. Kiểm tra RFC 3490. toASCII gọi nameprep (RFC 3491) tham chiếu stringprep (RFC 3454). Phần 3.2 "Gấp chữ" chỉ rõ bảng xếp chính xác (CaseFolding.txt) và phiên bản Unicode (3.2) Vì vậy, không chỉ có trường hợp không nhạy cảm, nhưng bảng chuyển đổi trường hợp chính xác được chỉ định. –

+0

Vì vậy, câu trả lời được phê duyệt không chính xác bằng cách nói "xác định chữ hoa và chữ thường có thể phức tạp trong ngôn ngữ và bộ ký tự ngoài ASCII". Đó là Unicode và phiên bản chính xác được chỉ định. Không có bộ ký tự nào khác. Ngay cả bài viết Wikipedia được đề xuất bởi "câu trả lời" nói "áp dụng thuật toán Nameprep, mà chuyển đổi nhãn thành chữ thường và thực hiện bình thường hóa khác". Vì vậy, xin vui lòng, trước khi bỏ phiếu xuống, làm bài tập về nhà. –

Các vấn đề liên quan