2011-11-25 26 views
8

Mã hóa chính thức cho API phát trực tuyến của Twitter là gì? Dự đoán tốt nhất của tôi là UTF-8 dựa trên những gì tôi đã thấy, nhưng tôi muốn tránh đưa ra các giả định.Mã hóa chính thức được Twitter Streaming API sử dụng? Có phải là UTF-8 không?

Phần duy nhất của trang web Twitter Tôi đã nhìn thấy nơi họ thậm chí còn gợi ý vào những gì họ sử dụng như mã hóa chính thức của họ là ở đây:

Twitter không muốn trừng phạt một người dùng cho thực tế chúng tôi sử dụng UTF -8 hoặc cho một thực tế mà khách hàng API trong câu hỏi sử dụng các đại diện còn

https://dev.twitter.com/docs/counting-characters

có ai có một nhiều hơn "chính thức" trả lời? Tôi đang viết trình thông báo trạng thái của máy cho API truyền trực tuyến, tạo nên các giả định nhất định. Điều cuối cùng tôi muốn là gặp phải một cái gì đó như UTF-16.

Cảm ơn! : D

Trả lời

4

Một chỉ báo là JSON format, mà Twitter sử dụng cho hầu như mọi thứ, mệnh lệnh (hoặc ít nhất là mặc định) UTF-8. Họ nên cũng đặt tiêu đề HTTP thích hợp biểu thị mã hóa (nhưng tôi chưa xác nhận điều này). Nếu bạn đang sử dụng XML thay vào đó, thẻ mở XML biểu thị rõ ràng mã hóa, là UTF-8.

0

Nếu họ nói rằng họ sử dụng UTF-8, đó là một đặt cược khá tốt. UTF-8 là rất phổ biến, và UTF-16 trong tự nhiên là khá hiếm từ những gì tôi đã nhìn thấy.

Ngoài ra còn có một số thư viện thông minh mà bạn có thể sử dụng nếu bạn có xu hướng tự chứng minh điều đó bằng cách kiểm tra xem chúng có hỗ trợ các ký tự khác nhau hay không. Tốt nhất trong số này được Firefox sử dụng để phát hiện mã hóa của các trang web khi chúng được tải: http://www-archive.mozilla.org/projects/intl/UniversalCharsetDetection.html

Các vấn đề liên quan