Tôi đã xây dựng một tài liệu Jsoup bằng cách phân tích một trang HTML trong nhà,Làm cách nào để chuyển đổi Tài liệu Jsoup sang Tài liệu W3C?
public Document newDocument(String path) throws IOException {
Document doc = null;
doc = Jsoup.connect(path).timeout(0).get();
return new HtmlDocument<Document>(doc);
}
tôi muốn chuyển đổi tài liệu Jsoup để org.w3c.dom.Document
của tôi, tôi đã sử dụng một thư viện có sẵn DOMBuilder cho điều này nhưng khi phân tích cú pháp tôi nhận được org.w3c.dom.Document
là null. Tôi không thể hiểu được sự cố, đã thử tìm kiếm nhưng không thể tìm thấy câu trả lời nào.
mã để tạo W3C DOM Document:
Document jsoupDoc=factory.newDocument("http:localhost/testcases/test_2.html"));
org.w3c.dom.Document docu= DOMBuilder.jsoup2DOM(jsoupDoc);
bất cứ ai có thể vui lòng giúp tôi về vấn đề này?
http://svn.apache.org/repos/asf/stanbol/trunk/enhancement-engines/htmlextractor/src/main/java/org/apache/stanbol/enhancer/engines/htmlextractor/impl/DOMBuilder .java –