Tôi sắp viết trình tìm nạp nguồn cấp dữ liệu RSS và bị kẹt với một số vấn đề về ký tự.Phản hồi được mã hóa http.get và ISO-8859-1
Tải và phân tích cú pháp nguồn cấp dữ liệu khá dễ dàng so với mã hóa. Tôi đang tải nguồn cấp dữ liệu với http.get
và tôi đang đặt các khối với nhau trên mọi sự kiện dữ liệu. Sau đó tôi phân tích cú pháp toàn bộ chuỗi bằng npm-lib feedparser
hoạt động tốt với chuỗi đã cho.
Rất tiếc, tôi đã quen với các chức năng như utf8_encode()
trong php và tôi thiếu chúng trong node.js vì vậy tôi bị kẹt với việc sử dụng Iconv hiện không làm những gì tôi muốn.
Nếu không mã hóa có một số utf8 -icons cho charset sai, với iconv, chuỗi được phân tách sai:/
Hiện nay tôi đang mã hóa tất cả các chuỗi seperatedly:
//var encoding ≈ ISO-8859-1 etc. (Is the right one, checked with docs etc.)
// Shortend version
var iconv = new Iconv(encoding, 'UTF-8');
parser.on('article', function(article){
var object = {
title : iconv.convert(article.title).toString('UTF-8'),
description : iconv.convert(article.summary).toString('UTF-8')
}
Articles.push(object);
});
Tôi nên bắt đầu mã hóa với bộ đệm dữ liệu hoặc sau đó với chuỗi hoàn chỉnh?
Cảm ơn bạn!
PS: Encoding được xác định với phân tích cú pháp người đứng đầu xml
Làm thế nào về một module mà làm cho mã hóa trong Node.js dễ dàng hơn?
phải là những gì bạn đã không làm việc? – loganfsmyth
Tôi không thể nhận mã hóa biểu tượng đúng – moe
Vì vậy, các đối tượng bài viết không được mã hóa chính xác và thay vào đó chứa rác? Và bạn có thể hiển thị nguồn cấp dữ liệu không? – fent