Khi tôi muốn phân tích cú pháp tài liệu XML bằng Python sử dụng thư viện BeautifulSoup, Tôi gặp phải một số vấn đề. Tài liệu XML mà tôi muốn phân tích cú pháp:Phân tích cú pháp XML không chuẩn (thẻ CDATA)
<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
Như bạn có thể thấy ở trên, thẻ hơi lạ. Theo tôi, rằng (tag) không phải là một dạng XML đứng, phải không? Làm thế nào tôi có thể phân tích mẫu khủng khiếp này?
Wow. Cảm ơn bạn vì sự hận thù của bạn – user513004
UserWarning: Lớp BeautifulStoneSoup không được chấp nhận. Thay vì sử dụng nó, chuyển các feature = "xml" vào hàm tạo của BeautifulSoup. –
Cập nhật câu trả lời của tôi để sử dụng BeautifulSoup4. – unutbu