Các tiêu chuẩn của Unicode Unicode® Technical Report #51includes một danh sách các biểu tượng cảm xúc (emoji-data.txt):
...
21A9 ; text ; L1 ; none ; j # V1.1 (↩) LEFTWARDS ARROW WITH HOOK
21AA ; text ; L1 ; none ; j # V1.1 (↪) RIGHTWARDS ARROW WITH HOOK
231A ; emoji ; L1 ; none ; j # V1.1 (⌚) WATCH
231B ; emoji ; L1 ; none ; j # V1.1 (⌛) HOURGLASS
...
Tôi tin rằng bạn sẽ muốn loại bỏ mỗi nhân vật được liệt kê trong tài liệu này mà đã có một Default_Emoji_Style
của emoji
.
Không có cách nào khác ngoài tham chiếu đến danh sách định nghĩa như thế này, để xác định các ký tự biểu tượng cảm xúc trong Unicode. Khi tham chiếu đến các câu hỏi thường gặp, chúng được lan truyền khắp các khối khác nhau.
[unicode.org] (http://www.unicode.org/emoji/charts/full-emoji-list.html) là hướng dẫn dứt khoát cho mọi thứ liên quan đến UTF. – usr2564301
Và nếu bạn đọc [Câu hỏi thường gặp về biểu tượng cảm xúc] (http://unicode.org/faq/emoji_dingbats.html), nó nói: "* Biểu tượng cảm xúc được trải rộng qua nhiều khối Unicode *", hiển nhiên trong [full biểu đồ cảm xúc] (http://www.unicode.org/emoji/charts/full-emoji-list.html), vì vậy bạn không thể sử dụng một kiểm tra phạm vi đơn lẻ để lọc chúng ra, bạn sẽ phải kiểm tra nhiều dải ô và thậm chí cả các giá trị cụ thể. –
Cảm ơn, Jongware và Remy. Nhưng tôi chỉ tò mò rằng có một danh sách các phạm vi mà tôi có thể trực tiếp sử dụng. Bởi vì có hơn 1.000 ký tự biểu tượng cảm xúc, phải mất một lúc để tìm ra các phạm vi từ biểu đồ – SL988