Tôi đang viết một số phần mềm xử lý thư bằng Python đang gặp phải các byte lạ trong các trường tiêu đề. Tôi nghi ngờ đây chỉ là thư không đúng định dạng; bản thân thông điệp tự xưng là ascii của chúng tôi, vì vậy tôi không nghĩ rằng có một mã hóa thực sự, nhưng tôi muốn lấy ra một chuỗi unicode xấp xỉ với chuỗi gốc mà không cần ném một số UnicodeDecodeError
.Có chức năng thư viện Python nào cố gắng đoán mã hóa ký tự của một số byte không?
Vì vậy, tôi đang tìm một hàm cần có một số str
và một số gợi ý tùy chọn và thực hiện gợi ý của nó để trả lại cho tôi unicode
. Tôi có thể viết một trong những khóa học, nhưng nếu như một chức năng tồn tại tác giả của nó có lẽ đã suy nghĩ sâu hơn một chút về cách tốt nhất để đi về điều này.
Tôi cũng biết rằng thiết kế của Python thích rõ ràng hơn và thư viện chuẩn được thiết kế để tránh ma thuật ngầm trong giải mã văn bản. Tôi chỉ muốn nói rõ ràng "đi trước và đoán".
Bạn có thể bỏ qua trường hợp '' ascii'' ở cuối và chỉ sử dụng 'latin1', vì' latin1' sẽ giải mã tất cả các giá trị 256 byte mà không có lỗi. –