2012-08-30 22 views
5

Nếu tôi sử dụng nàycó được mã nguồn trang web với html rendered từ javascript

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://test.net"); 

tôi có thể sử dụng các gói nhanh nhẹn để quét html và nhận được hầu hết các thẻ mà tôi cần nhưng thiếu của nó html được hiển thị bởi javascript.

Câu hỏi của tôi là, làm thế nào để tôi nhận được mã nguồn trang web rendered thức sử dụng C#. Có một cái gì đó nhiều hơn để WebClient để có được nguồn gốc cuối cùng sau khi javascript được chạy?

+0

tôi nghi ngờ bạn có thể làm điều này với một mình C#. – ceejayoz

Trả lời

1

Gói HTML Agility một mình không đủ để làm những gì bạn muốn, Bạn cũng cần một công cụ javascript. Để làm điều đó, bạn có thể muốn kiểm tra một cái gì đó như Geckofx, điều này sẽ cho phép bạn nhúng một trình duyệt web đầy đủ chức năng vào ứng dụng của bạn, và hơn cho phép bạn lập trình truy cập nội dung của dom sau khi trang đã hiển thị.

http://code.google.com/p/geckofx/

+0

geckofx mới hơn có thể được tìm thấy tại đây: https://bitbucket.org/geckofx/geckofx-14.0/ – Tom

Các vấn đề liên quan