2012-12-19 47 views
19

Tôi đang cố gắng loại bỏ một trang web bằng cách sử dụng súp trăn và đẹp. Tôi gặp phải điều đó ở một số trang web, các liên kết hình ảnh mặc dù được thấy trên trình duyệt không thể được nhìn thấy trong mã nguồn. Tuy nhiên, khi sử dụng Chrome Inspect hoặc Fiddler, chúng ta có thể thấy các mã tương ứng. Những gì tôi nhìn thấy trong mã nguồn là:Đọc các trang web được tạo theo kiểu động bằng cách sử dụng python

<div id="cntnt"></div> 

Nhưng trên Chrome Kiểm tra, tôi có thể nhìn thấy một bó toàn bộ HTML \ mã CSS được tạo ra trong lớp div này. Có cách nào để tải nội dung được tạo ra cũng trong python? Tôi đang sử dụng urllib thường xuyên trong python và tôi có thể nhận được nguồn nhưng không có phần được tạo ra.

Tôi không phải là nhà phát triển web vì vậy tôi không thể thể hiện hành vi theo cách tốt hơn. Xin vui lòng làm rõ nếu câu hỏi của tôi có vẻ mơ hồ!

+7

Nội dung của trang web có thể được tạo sau khi tải qua javascript, Do đó, hãy tham khảo câu trả lời này -> http://stackoverflow.com/questions/8960288/get-page-generated-with-javascript-in-python – ppsreejith

+0

Có thể bạn cung cấp URL được đề cập? Sẽ giúp chẩn đoán – jdotjdot

Trả lời

5

Nội dung của trang web có thể được tạo ra sau khi tải qua javascript, Để có được kịch bản tạo ra thông qua python tham khảo this answer

+2

Trong khi liên kết này có thể trả lời câu hỏi, tốt hơn nên bao gồm các phần thiết yếu của câu trả lời ở đây và cung cấp liên kết để tham khảo. Câu trả lời chỉ liên kết có thể trở thành không hợp lệ nếu trang được liên kết thay đổi. - [Từ đánh giá] (/ đánh giá/bài đăng chất lượng thấp/18007370) – Rabbid76

Các vấn đề liên quan