2012-11-06 43 views
5

Tôi muốn tìm các ký tự giống hệt nhau cho một ký tự cụ thể trong Unicode. Tôi biết cách tìm các phân tích hợp chuẩn hoặc tương thích của một ký tự; nhưng họ không cho tôi những gì tôi muốn. Tôi muốn tìm các ký tự giống hệt nhau (không giống nhau) và sự khác biệt duy nhất của chúng có thể là kích thước của chúng.Các ký tự giống hệt nhau trong Unicode

ví dụ tôi muốn: (s, S) hoặc (S, S) (có các điểm mã khác nhau). Tôi không muốn (ß, β), hoặc (e, é).

Mọi đề xuất? Cảm ơn.

+2

Unicode không chỉ định ngoại hình của các ký tự. Đó là một vấn đề về phông chữ. (Tiêu chuẩn sử dụng các hình ảnh _representative_, nhưng chúng không phải là một phần của tiêu chuẩn.) Ví dụ, bạn có muốn vốn I và chữ số 1 và chữ thường l không? Trong một số phông chữ, chúng giống hệt nhau và trong các phông chữ khác, chúng đều khác nhau. –

Trả lời

5

Đối với một ký tự cụ thể, bạn có thể bắt đầu từ chú thích trong biểu đồ mã trong tiêu chuẩn Unicode. Các chú thích thường đề cập đến các ký tự khác vì nhiều lý do khác nhau, bao gồm sự giống nhau hoặc nhận dạng hình dạng. Nhưng chú thích không có nghĩa là bao quát mọi thứ.

Bạn cũng có thể vẽ nhân vật của mình tại http://shapecatcher.com/ và yêu cầu nhận dạng ký tự đó. Bạn thường nhận được một danh sách dài các lựa chọn thay thế trực quan tương tự.

Khi @TedHopp viết trong nhận xét của mình, danh tính trực quan phụ thuộc vào phông chữ. Ví dụ, “s” và “S” không cần phải giống hệt nhau; trong hầu hết các phông chữ, chúng không phải là - dạng cơ bản giống nhau, nhưng có nhiều khác biệt về độ rộng nét, độ cong, serif, vv Tuy nhiên, một số ký tự có thể trông giống hệt nhau trong bất kỳ phông chữ nào chứa chúng, như thủ đô A của A, thủ đô Hy Lạp alpha Α, và thủ đô Kirin.

Bạn không chỉ định mục đích của nghiên cứu, nhưng bạn có thể đang thực hiện điều gì đó đã được thực hiện ở một mức độ nào đó bởi Hiệp hội Unicode. Xem UTR #6, Cân nhắc bảo mật Unicode, cũng chứa tham chiếu đến công việc liên quan, bao gồm UTS #9, Cơ chế bảo mật Unicode, chứa confusables.txt, Bản đồ có thể sử dụng nhầm lẫn được đề xuất cho IDN (ví dụ, cho một ngữ cảnh cụ thể, nhưng có thể lãi cho các mục đích khác).

Các vấn đề liên quan