Tôi đang phát triển một ứng dụng đọc văn bản thuần túy. Đôi khi, ứng dụng không thể tự động xác định mã hóa của tệp, do đó, người dùng cần chọn mã hóa từ danh sách mã hóa. Nếu danh sách này chứa tất cả các mã hóa được hỗ trợ, nó sẽ quá dài. Tôi muốn cung cấp một danh sách đơn giản, chỉ chứa các mã hóa phổ biến nhất của mỗi ngôn ngữ.Mã hóa phổ biến nhất của mỗi ngôn ngữ là gì?
Đây là một số mối quan hệ tôi được biết:
- truyền thống Trung Quốc: Big5
- Tiếng Trung giản thể: GB18030
- Nhật Bản: Shift-JIS, EUC-JP
- Nga: KOI8-R
Nếu bạn biết mã hóa phổ biến nhất của ngôn ngữ khác, vui lòng cho tôi biết.
Bạn có cố tình bỏ qua các họ Unicode không? UTF-8, UTF-16 và UTF-32 chắc chắn được sử dụng ít nhất là những cái bạn đã đặt tên. –
@TomvanderWoerdt Có, tôi cần danh sách mã hóa vùng, loại trừ mã hóa Unicode. Ví dụ, GB18030 là tiêu chuẩn quốc gia của PRC, vì vậy nó được sử dụng rộng rãi ở Trung Quốc đại lục. – user805627