Tôi đã sử dụng phương pháp này để lấy một trang web thành một đối tượng org.jsoup.nodes.Document
:Làm cách nào để lưu Tài liệu Jsoup vào một tệp HTML?
myDoc = Jsoup.connect(myURL).ignoreContentType(true).get();
Làm thế nào tôi nên viết đối tượng này vào một tập tin HTML? Phương thức myDoc.html()
, myDoc.text()
và myDoc.toString()
không xuất tất cả các phần tử của tài liệu.
Một số thông tin trong phần tử javascript có thể bị mất khi phân tích cú pháp. Ví dụ: "dấu thời gian" trong nguồn của trang phương tiện Instagram.
Bạn thiếu những yếu tố gì khi gọi 'myDoc.html()'? – cy3er
Một số yếu tố có thể bị xóa hoặc phân tích cú pháp khác khi bạn sử dụng Jsoup để tìm nạp. Sử dụng danh sách trắng để sửa lỗi! –
@ cy3er Tôi đã thêm một ví dụ. Trong trường hợp này, dung dịch của alkis hoạt động. –