Trong Python 3.x, một chuỗi bao gồm các mục Unicode thứ tự. (Xem báo giá từ tham chiếu ngôn ngữ bên dưới.) Biểu diễn bên trong của chuỗi Unicode là gì? Có phải là UTF-16 không?Biểu diễn nội bộ của chuỗi trong Python 3.x
Các mục của đối tượng chuỗi là Đơn vị mã Unicode. Mã Unicode đơn vị được biểu thị bằng một đối tượng chuỗi của một mục và có thể giữ giá trị 16 bit hoặc 32 bit đại diện cho một số Unicode (giá trị tối đa cho thứ tự được đưa ra trong sys.maxunicode, và phụ thuộc vào cách Python được định cấu hình tại thời gian biên dịch). Cặp thay thế có thể có mặt trong đối tượng Unicode và sẽ được báo cáo dưới dạng hai mục riêng biệt.
Điều này có ý nghĩa gì? Vấn đề gì được giải quyết bằng cách biết các biểu diễn bên trong? –
Tôi cảm thấy tôi học được nhiều hơn bằng cách đặt câu hỏi sai. – thebat
Đây là câu hỏi hợp lệ, nếu không có lý do nào khác ngoài việc biết giá trị của 'ord ('העטלף')' sẽ là gì. – dotancohen