Tôi có một tài liệu đã được thực hiện trong jsoup trông như thế này Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Làm thế nào để tôi chuyển đổi mà doc thành một chuỗi .
như lớp DOMDocument trong PHP, có bất kỳ lớp nào bằng RUBY (tức là RUBY cốt lõi), để phân tích cú pháp và nhận giá trị của phần tử nút từ Tài liệu HTML hay không.
Tôi cần phân tích cú pháp html có khả năng xác định lỗi trong html được tạo và nếu thẻ không được đóng, sau đó đóng và trả lại html hợp lệ. Thêm chi tiết: tôi đang nhận dữ liệu từ cơ sở dữ liệu và ngắ
Tôi đang lộn xộn với GoogleDocs và nó có hỗ trợ CSS rất nguyên thủy. Nếu bạn tải lên tệp MSWord .doc hoặc HTML và xuất tệp dưới dạng HTML, tất cả các kiểu được áp dụng nội tuyến. Họ có một khối kiểu t