Tôi đang đọc tệp chứa từ tiếng Rumani bằng Python với tệp.readline(). Tôi gặp sự cố với nhiều ký tự do mã hóa.UnicodeDecodeError: codec 'ascii' không thể giải mã
Ví dụ:
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
Tôi đã thử encode() với utf-8, CP500 vv, nhưng nó không hoạt động.
Tôi không thể tìm thấy mã hóa ký tự phù hợp mà tôi phải sử dụng là gì?
cảm ơn trước.
Edit: Mục đích là để lưu trữ từ từ tập tin trong một dictionnary, và khi in nó, để có được aberaţie và không phải là 'Abera \ xc8 \ x9bie'