Có ai biết làm thế nào để có được mã hóa của một tập tin bằng Python. Tôi biết rằng bạn có thể sử dụng các mô-đun codec để mở một tập tin với một mã hóa cụ thể nhưng bạn phải biết nó trước.Làm cách nào để biết mã hóa của một tệp bằng Python?
import codecs
f = codecs.open("file.txt", "r", "utf-8")
Có cách nào để tự động phát hiện mã hóa nào được sử dụng cho tệp không?
Cảm ơn trước
Edit: Cảm ơn tất cả mọi người cho answsers rất thú vị. Bạn cũng có thể quan tâm bởi http://whatismyencoding.com/ mà là dựa trên chardet (nhiều hơn các trang web được cung cấp bởi chai khuôn khổ python)
Ý tưởng tuyệt vời. Cảm ơn. –
Tôi đã đơn giản hóa và điều chỉnh điều này một chút, chỉ bằng cách sử dụng .decode() trong một lần thử, ngoại trừ việc xảy ra khi (1) chuyển đổi thành công hoặc (2) sau khi hết bảng mã_guess_list. Nếu kết thúc là một thất bại, sau đó tôi áp dụng một khác nhau .decode() với các lỗi thiết lập để 'thay thế' thay vì 'nghiêm ngặt'. – JDM