Cho một mảng byte biểu diễn văn bản trong một số mã hóa không xác định (thường là UTF-8 hoặc ISO-8859-1, nhưng không nhất thiết như vậy), cách tốt nhất để có được một đoán cho mã hóa có khả năng nhất được sử dụng (trong Java)?Đoán mã hóa của văn bản được biểu diễn dưới dạng byte [] trong Java
Worth chú ý:
- Không thêm siêu dữ liệu có sẵn. Mảng byte theo nghĩa đen là đầu vào duy nhất có sẵn.
- Thuật toán phát hiện rõ ràng sẽ không chính xác 100%. Nếu thuật toán chính xác hơn 80% các trường hợp đủ tốt.
http://stackoverflow.com/questions/373081/ có thể giúp đỡ – Chris