2010-10-02 47 views
10

Tôi đang xóa một trang web sử dụng Javascript để tự động điền nội dung của trang web bằng gói Agility Html.Gói Agility Html: Tìm nút nhận xét

Về cơ bản, tôi đã tìm kiếm XPATH "\\div[@class='PricingInfo']", nhưng nút div đó đã được ghi vào DOM qua Javascript.

Vì vậy, khi tôi tải trang thông qua gói Nhanh nhạy Html, XPATH đã đề cập ở trên không thể tìm thấy.

Hóa ra có một nhận xét trước một khối tập lệnh cụ thể mà tôi muốn phân tích cú pháp.

<!--Module 328 Buying Options Table--> 
<script type="text/javascript" language="JavaScript"> 
    var data = { 
     price: 30.00 
    } 
</script> 

Đối với trang web này, có rất nhiều khối kịch bản và vì vậy tôi sẽ cần phải thu hẹp nó xuống bằng cách phát hiện tự động tạo ra nhận xét này <!--Module 328 Buying Options Table--> và anh chị em ruột của nút đó sẽ là khối kịch bản chính xác.

Bất kỳ ý tưởng nào về cách tôi có thể tìm kiếm nhận xét cụ thể và sau đó chỉ nhận khối tập lệnh liền kề?

Cảm ơn bạn!

+1

+1 không sử dụng cụm từ thông dụng! – TrueWill

Trả lời

15
htmlDoc.DocumentNode.SelectSingleNode("//comment()[contains(., 'Buying Options')]/following-sibling::script") 
+0

hoạt động như một sự quyến rũ. cảm ơn bạn! Bây giờ, tôi cần một cách để phân tích cú pháp đối tượng Javascript. – Abe

+0

Chỉ cần thêm một điều nữa. Khi tôi nhận được ghi chú kịch bản, tôi có thể phân tích thông tin tôi cần bằng cách sử dụng cụm từ thông dụng. cảm ơn! – Abe

Các vấn đề liên quan