Tôi nhận thấy có điều gì đó kỳ lạ khi sử dụng Nokogiri gần đây. Tất cả HTML tôi đã phân tích cú pháp đã được cung cấp các thẻ bắt đầu và kết thúc <html>
và <body>
.Làm thế nào để ngăn chặn Nokogiri thêm <DOCTYPE> thẻ?
<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n
Làm cách nào để ngăn Nokogiri thực hiện việc này?
IE, khi tôi làm:
doc = Nokogiri::HTML("<div>some content</div>")
doc.to_s
hay:
doc.to_html
tôi nhận được bản gốc:
<html blah><body>div>some content</div></body></html>
phiên bản Nokogiri? – shingara
nokogiri (1.4.3.1) – holden