Tôi cần các chức năng để chuyển đổi giữa một ký tự (ví dụ: 'α'
) và tên Unicode đầy đủ của nó (ví dụ: "GREEK SMALL LETTER ALPHA"
) theo cả hai hướng.Làm thế nào để chuyển đổi một char thành tên Unicode đầy đủ của nó?
Giải pháp mà tôi đưa ra là thực hiện tra cứu trong chuẩn Unicode chính thức có sẵn trực tuyến: http://www.unicode.org/Public/6.2.0/ucd/UnicodeData.txt, hoặc, trong bản sao cục bộ được lưu trong bộ nhớ cache, có thể được chuyển đổi thành bộ sưu tập phù hợp trước để cải thiện hiệu suất tra cứu).
Có cách nào đơn giản hơn để thực hiện các chuyển đổi này không? Tôi thích một giải pháp trong C#, nhưng các giải pháp bằng các ngôn ngữ khác có thể thích ứng với C#/.NET cũng được hoan nghênh. Cảm ơn!
Giải pháp bạn có âm thanh hoàn toàn tốt với tôi, thành thật mà nói. Định dạng tệp trông có vẻ đơn giản và tôi không nghĩ có gì khác trong khung công tác. –
Liên kết mà bạn trỏ đến chỉ giống như 1 triệu đầu tiên và dễ dàng phù hợp với từ điển. Ký tự phải là duy nhất để sử dụng nó làm khóa trong Từ điển. Đối với mô tả - nếu nó là duy nhất có thể bao gồm một từ điển đảo ngược thứ hai cho tốc độ nhưng điều đó sẽ tăng gấp đôi bộ nhớ. – Paparazzi
@Blam "chỉ giống như 1 triệu đầu tiên" (chính xác hơn là 1114109) là ** tất cả chúng **. –