Tôi đang thực hiện một số trang web và các trang web thường xuyên sử dụng các thực thể HTML để biểu diễn các ký tự ascii không. Liệu Python có một tiện ích mà có một chuỗi với các thực thể HTML và trả về một kiểu unicode?Chuyển đổi các đối tượng XML/HTML thành chuỗi Unicode trong Python
Ví dụ:
tôi nhận được trở lại:
ǎ
đại diện cho một "ǎ" với một dấu giai điệu. Trong dạng nhị phân, điều này được biểu diễn dưới dạng 16 bit 01 bit. Tôi muốn chuyển đổi đơn vị html vào giá trị u'\u01ce'
liên quan: [Giải mã HTML thực thể trong Python chuỗi?] (Http://stackoverflow.com/q/2087370/4279) – jfs