2012-02-07 29 views
5

Tôi đang thiết kế một API lấy URL làm đầu vào và đọc nội dung tại URL đó. Khi URL là giao thức "tệp:", điều gì sẽ làm cho mặc định tốt hơn cho mã hóa ký tự?Mã hóa mặc định cho API đọc từ URL sử dụng giao thức: tệp là gì?

  • của hệ thống mã hóa bản địa
  • UTF-8

API cho phép này được thiết lập một cách rõ ràng. Ngoài ra, có một vài chẩn đoán chúng ta có thể sử dụng để xác định mã hóa ký tự, như BOM nếu có, nhưng khi tất cả các lỗi này không thành công, thì điều gì sẽ là mặc định?

Theo như tôi có thể nói, các tiêu chuẩn là im lặng về vấn đề này. Tất cả những người khác đều bình đẳng, tôi muốn điều đúng đắn xảy ra thường xuyên nhất cho một người thậm chí không biết có một thứ như mã hóa ký tự.

Trả lời

2

Luôn sử dụng UTF-8 nếu có thể và ghi lại tài liệu này trong tài liệu API của bạn. UTF-8 là một tiêu chuẩn vững chắc về mã hóa và bằng chứng trong tương lai - Tôi sẽ tránh tạo ra công việc tiềm năng cho bản thân bằng cách hỗ trợ các mã hóa khác - UTF-8 sẽ dễ sử dụng nếu bạn di chuyển API để sử dụng theo cách nó có thể được truy cập thông qua một dịch vụ Web.

Các vấn đề liên quan