Làm cách nào để tôi có thể xóa dữ liệu được tạo động bằng JavaScript trong tài liệu html bằng C#?Cắt dữ liệu được tạo động bởi JavaScript trong tài liệu html bằng C#
Sử dụng WebRequest
và HttpWebResponse
trong thư viện C#, tôi có thể nhận được toàn bộ mã nguồn html dưới dạng chuỗi, nhưng khó khăn là dữ liệu tôi muốn không được chứa trong mã nguồn; dữ liệu được tạo động bởi JavaScript.
Mặt khác, nếu dữ liệu tôi muốn đã có trong mã nguồn, thì tôi có thể dễ dàng sử dụng chúng bằng cách sử dụng Cụm từ thông dụng.
Tôi đã tải HtmlAgilityPack
, nhưng tôi không biết nếu nó sẽ chăm sóc các trường hợp mục được tạo động bởi JavaScript ...
Cảm ơn bạn rất nhiều!
Bạn sẽ phải chạy qua một công cụ JavaScript. Có lẽ một cái gì đó như [Awesomium] (http://www.awesomium.com/)? –
Hãy xem tại đây: http://stackoverflow.com/questions/18539491/headless-browser-and-scraping-solutions – sagibb