Im mã hóa trong Java ..nhận được tất cả html như một String từ HTMLDocument
Có ai biết làm thế nào tôi có thể nhận được nội dung của một javax.swing.text.html.HTMLDocument như một String? Đây là những gì tôi đã có cho đến nay ...
URL url = new URL("http://www.test.com");
HTMLEditorKit kit = new HTMLEditorKit();
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument();
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream());
kit.read(HTMLReader, doc, 0);
Tôi cần nội dung của HTMLDocument làm Chuỗi.
Ví dụ:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">
....... vv
Bất kỳ trợ giúp sẽ được đánh giá cao. Tôi cần phải sử dụng lớp HTMLDocument để cho html để được xử lý một cách chính xác :)
Cảm ơn Daniel
Cảm ơn! Mã Joop Eggens đã làm các trick! – Zelleriation