2010-06-25 29 views

Trả lời

10

Tôi muốn giới thiệu Jsoup cho việc này. Nó có một API rất đẹp với sự hỗ trợ cho jQuery like CSS selectors and non-verbose element iteration. Để có một bản sao của this answer là một ví dụ, đây in câu hỏi của riêng bạn và tên của tất cả người trả lời ở đây:

URL url = new URL("https://stackoverflow.com/questions/3121136"); 
Document document = Jsoup.parse(url, 3000); 

String question = document.select("#question .post-text").text(); 
System.out.println("Question: " + question); 

Elements answerers = document.select("#answers .user-details a"); 
for (Element answerer : answerers) { 
    System.out.println("Answerer: " + answerer.text()); 
} 

Một thay thế sẽ là XPath, nhưng JSoup là hữu ích hơn cho webdevelopers người đã có một nắm bắt tốt về Bộ chọn CSS.

+0

Cảm ơn! Điều này có vẻ tuyệt vời. – egervari

+0

Bạn được chào đón. – BalusC

1

Điều tốt nhất sẽ là công việc được thực hiện đúng.

Có một opensource một gọi tagsoup, và cũng jTidy

Các vấn đề liên quan