Hialxml - khó phân tích cú pháp stackexchange rss feed
Tôi gặp sự cố khi phân tích cú pháp nguồn cấp dữ liệu rss từ stackexchange trong python. Khi tôi cố gắng nhận các nút tóm tắt, danh sách trống sẽ trả về
Tôi đã cố gắng giải quyết vấn đề này, nhưng không thể xoay đầu.
Có ai có thể giúp bạn không? nhờ một
In [3o]: import lxml.etree, urllib2
In [31]: url_cooking = 'http://cooking.stackexchange.com/feeds'
In [32]: cooking_content = urllib2.urlopen(url_cooking)
In [33]: cooking_parsed = lxml.etree.parse(cooking_content)
In [34]: cooking_texts = cooking_parsed.xpath('.//feed/entry/summary')
In [35]: cooking_texts
Out[35]: []
'data.xpath ('// ns: thức ăn chăn nuôi/ns: lối vào/ns: tóm tắt', namespace = { 'ns': 'http: //www.w3.org/2005/Atom '}) ' – reclosedev
gah, không có gì lạ! Có vẻ như api đã đổi tên từ khóa 'namespaces' tại một số điểm. Cập nhật mẫu của tôi với mã làm việc. – gfortune
cảm ơn bạn rất nhiều. Tôi sẽ bắt đầu kiểm tra thư mục gốc trước khi phân tích nó. – MrCastro