Tôi đang cố gắng loại bỏ một trang web bằng cách sử dụng súp trăn và đẹp. Tôi gặp phải điều đó ở một số trang web, các liên kết hình ảnh mặc dù được thấy trên trình duyệt không thể được nhìn thấy trong mã nguồn. Tuy nhiên, khi sử dụng Chrome Inspect hoặc Fiddler, chúng ta có thể thấy các mã tương ứng. Những gì tôi nhìn thấy trong mã nguồn là:Đọc các trang web được tạo theo kiểu động bằng cách sử dụng python
<div id="cntnt"></div>
Nhưng trên Chrome Kiểm tra, tôi có thể nhìn thấy một bó toàn bộ HTML \ mã CSS được tạo ra trong lớp div này. Có cách nào để tải nội dung được tạo ra cũng trong python? Tôi đang sử dụng urllib thường xuyên trong python và tôi có thể nhận được nguồn nhưng không có phần được tạo ra.
Tôi không phải là nhà phát triển web vì vậy tôi không thể thể hiện hành vi theo cách tốt hơn. Xin vui lòng làm rõ nếu câu hỏi của tôi có vẻ mơ hồ!
Nội dung của trang web có thể được tạo sau khi tải qua javascript, Do đó, hãy tham khảo câu trả lời này -> http://stackoverflow.com/questions/8960288/get-page-generated-with-javascript-in-python – ppsreejith
Có thể bạn cung cấp URL được đề cập? Sẽ giúp chẩn đoán – jdotjdot