Tôi phải trích xuất một số thông tin từ một trang web và định dạng lại thông tin đó cho người dùng.Phân tích cú pháp HTML từ một trang web
Vì trang web có phần thường xuyên, bây giờ tôi sử dụng HttpClient để truy xuất HTML dưới dạng chuỗi và tôi trích xuất dữ liệu tại các vị trí nhất định bằng dữ liệu có liên quan.
Dù sao thì tôi tự hỏi liệu có cách nào tốt hơn, có thể là cách nhận thức HTML. Bạn sẽ làm điều này như thế nào?
Chúc mừng
bản sao có thể có của [Phân tích HTML Java] (http://stackoverflow.com/questions/238036/java-html-parsing) –
http://stackoverflow.com/questions/4623427/html-parsing-using-java –
http://stackoverflow.com/questions/4614211/java-html-parsing –