Làm cách nào để giải mã các chuỗi như chuỗi "weren \ xe2 \ x80 \ x99t" này trở lại chế độ mã hóa thông thường.Các sự cố mã hóa/giải mã Python
Vì vậy, từ này thực sự không phải là "weren \ xe2 \ x80 \ x99t"? Ví dụ:.
print "\xe2\x80\x9cThings"
string = "\xe2\x80\x9cThings"
print string.decode('utf-8')
print string.encode('ascii', 'ignore')
“Things
“Things
Things
Nhưng tôi thực sự muốn có được" Mọi thứ
hay:
print "weren\xe2\x80\x99t"
string = "weren\xe2\x80\x99t"
print string.decode('utf-8')
print string.encode('ascii', 'ignore')
weren’t
weren’t
werent
Nhưng tôi thực sự muốn có được không
Làm thế nào nên tôi. làm điều này?
Bạn sẽ cần phải cung cấp từ điển dịch mong muốn của bạn - ví dụ, từ báo giá ưa thích để những ASCII đồng bằng - và sử dụng phương thức chuỗi Unicode của '.translate' để áp dụng nó. Tôi không nghĩ rằng có một tiêu chuẩn "asciify nó xuống" từ điển dịch thuật xung quanh ... –
Vâng, tôi chỉ cần thực hiện một :) – Brana