Tôi là người mới bắt đầu thu thập thông tin. Tôi có yêu cầu tìm nạp các bài đăng và nhận xét từ một liên kết. Tôi muốn tự động hóa quá trình này. Tôi đã xem xét sử dụng webcrawler và jsoup cho điều này nhưng được cho biết rằng webcrawlers chủ yếu được sử dụng cho các trang web có chiều sâu lớn hơn.Tìm nạp nội dung (tải qua cuộc gọi AJAX) của một trang web
mẫu cho một trang: Jive trang web cộng đồng
Đối với trang này, khi tôi xem mã nguồn của trang, tôi có thể thấy chỉ bưu chính, không phải là ý kiến. Hãy suy nghĩ điều này là bởi vì các chú thích được tìm nạp thông qua một cuộc gọi AJAX đến máy chủ.
Do đó, khi tôi sử dụng jsoup, nó không tìm nạp nhận xét.
Vậy làm cách nào tôi có thể tự động hóa quá trình tìm nạp bài đăng và nhận xét?
Tất cả nhận xét được tải từ Cơ sở dữ liệu jive, không có liên kết ẩn nào để truy cập văn bản thô cho nhận xét. Nên có một liên kết tôi đã tìm kiếm (nếu bạn gõ kịch bản java có thể u có thể knw là họ gọi nó từ đây: https: //www.heylululemon.com/6.0.2.0/resources/scripts/gen/b0e45f40028721e48611c14803fef20d.js) được gọi từ trang web để nhận các nhận xét nhưng tôi không thấy. Bạn đã thử khả năng xem web chưa. – ImGeorge
Bản sao có thể có của [Trình phân tích cú pháp Java Java Jsoup: Thực thi các sự kiện javascript] (http://stackoverflow.com/questions/7344258/jsoup-java-html-parser-executing-javascript-events) – Pshemo