Thường thì người ta muốn liệt kê tất cả các ký tự trong một danh mục Unicode đã cho. Ví dụ:Liệt kê tất cả các ký tự trong một danh mục Unicode nhất định
- List all Unicode whitespace, How can I get all whitespaces in UTF-8 in Python?
- Characters with the property
Alphabetic
Có thể tạo ra danh sách này bằng cách duyệt qua tất cả các mã Unicode-điểm và thử nghiệm cho danh mục bạn muốn (Python 3):
[c for c in map(chr, range(0x110000)) if unicodedata.category(c) in ('Ll',)]
hoặc sử dụng regexes,
re.findall(r'\s', ''.join(map(chr, range(0x110000))))
Nhưng các phương pháp này chậm. Có cách nào để tìm kiếm danh sách các nhân vật trong danh mục mà không phải lặp lại tất cả các ký tự đó không?
câu hỏi liên quan cho Perl: How do I get a list of all Unicode characters that have a given property?
chr() nên được thay thế bằng unichr() trong bản đồ() –
@ m.kocikowski: trừ khi bạn đang sử dụng Python 3, mà OP của câu hỏi rõ ràng là (nó sẽ thất bại trong Python 2 nếu không). –