Đối với một ký tự cụ thể, bạn có thể bắt đầu từ chú thích trong biểu đồ mã trong tiêu chuẩn Unicode. Các chú thích thường đề cập đến các ký tự khác vì nhiều lý do khác nhau, bao gồm sự giống nhau hoặc nhận dạng hình dạng. Nhưng chú thích không có nghĩa là bao quát mọi thứ.
Bạn cũng có thể vẽ nhân vật của mình tại http://shapecatcher.com/ và yêu cầu nhận dạng ký tự đó. Bạn thường nhận được một danh sách dài các lựa chọn thay thế trực quan tương tự.
Khi @TedHopp viết trong nhận xét của mình, danh tính trực quan phụ thuộc vào phông chữ. Ví dụ, “s” và “S” không cần phải giống hệt nhau; trong hầu hết các phông chữ, chúng không phải là - dạng cơ bản giống nhau, nhưng có nhiều khác biệt về độ rộng nét, độ cong, serif, vv Tuy nhiên, một số ký tự có thể trông giống hệt nhau trong bất kỳ phông chữ nào chứa chúng, như thủ đô A của A, thủ đô Hy Lạp alpha Α, và thủ đô Kirin.
Bạn không chỉ định mục đích của nghiên cứu, nhưng bạn có thể đang thực hiện điều gì đó đã được thực hiện ở một mức độ nào đó bởi Hiệp hội Unicode. Xem UTR #6, Cân nhắc bảo mật Unicode, cũng chứa tham chiếu đến công việc liên quan, bao gồm UTS #9, Cơ chế bảo mật Unicode, chứa confusables.txt, Bản đồ có thể sử dụng nhầm lẫn được đề xuất cho IDN (ví dụ, cho một ngữ cảnh cụ thể, nhưng có thể lãi cho các mục đích khác).
Nguồn
2012-11-07 08:10:57
Unicode không chỉ định ngoại hình của các ký tự. Đó là một vấn đề về phông chữ. (Tiêu chuẩn sử dụng các hình ảnh _representative_, nhưng chúng không phải là một phần của tiêu chuẩn.) Ví dụ, bạn có muốn vốn I và chữ số 1 và chữ thường l không? Trong một số phông chữ, chúng giống hệt nhau và trong các phông chữ khác, chúng đều khác nhau. –