Tôi đang thiết kế một API lấy URL làm đầu vào và đọc nội dung tại URL đó. Khi URL là giao thức "tệp:", điều gì sẽ làm cho mặc định tốt hơn cho mã hóa ký tự?Mã hóa mặc định cho API đọc từ URL sử dụng giao thức: tệp là gì?
- của hệ thống mã hóa bản địa
- UTF-8
API cho phép này được thiết lập một cách rõ ràng. Ngoài ra, có một vài chẩn đoán chúng ta có thể sử dụng để xác định mã hóa ký tự, như BOM nếu có, nhưng khi tất cả các lỗi này không thành công, thì điều gì sẽ là mặc định?
Theo như tôi có thể nói, các tiêu chuẩn là im lặng về vấn đề này. Tất cả những người khác đều bình đẳng, tôi muốn điều đúng đắn xảy ra thường xuyên nhất cho một người thậm chí không biết có một thứ như mã hóa ký tự.