Trong khi cố gắng xử lý phản hồi JSON với GSON (đầu ra là từ API flickr trong trường hợp bạn đang hỏi) Tôi đã gặp phải những gì tôi mô tả dưới dạng mã hóa khá lạ của một số ký tự đặc biệt:GSON/JSON: Vấn đề char đặc biệt (umlaut)
Dưới đây là một cái nhìn hex của nó:
các 'u' tiếp theo là 'đúp chấm' là những gì cho là một người Đức ' ü ', và đây là nơi mà sự nhầm lẫn của tôi bắt đầu. Nó như thể ai đó lấy chiếc xe và tách nó ra làm đôi, mã hóa từng mảnh. Những hình ảnh dưới đây cho thấy các mã hex của những gì tôi mong đợi nó được trong trường hợp 'U' được mã hóa một cách chính xác:
Thậm chí nhiều hơn lạ, trong trường hợp tôi mong chờ các vấn đề xảy ra (cụ thể là , bộ ký tự châu Á) mọi thứ dường như hoạt động tốt, ví dụ "Title": "ナ ガ レ テ ユ ク · · ·"
Câu hỏi:
- Có phải đó là một số kỳ quặc flickrAPI hoặc mã hóa JSON chính xác cho các reposonse? Hoặc là nó được mã hóa đúng JSON và GSON không thể 'tái lắp ráp' phản ứng này vào 'ü' ban đầu. Hay tác giả của thông điệp tiêu đề chỉ đơn giản là vặn nó vào phần của anh ta?
- Làm cách nào để giải quyết vấn đề (trong trường hợp đó là JSON hoặc GSON đang rối tung xung quanh, rõ ràng không thể làm bất cứ điều gì nếu đó là tác giả). Làm thế nào để tôi biết những ký tự 'khác' bị ảnh hưởng (ö và ä đến tâm trí, nhưng có lẽ có nhiều 'trường hợp đặc biệt').
Trình gỡ xuống có thể giải thích tại sao không? –