Tôi đang sử dụng Python 2.7 với Selenium WebDriver. Câu hỏi của tôi là cách in toàn bộ nguồn trang với phương pháp print
. Có phương pháp webdriver page_source
nhưng nó sẽ trả về WebDriver và tôi không biết làm thế nào để chuyển đổi nó để String hoặc chỉ cần in tại nhà gaPython WebDriver cách in toàn bộ nguồn trang (html)
7
A
Trả lời
22
.page_source
về một trường hợp webdriver
là những gì bạn cần:
>>> from selenium import webdriver
>>> driver = webdriver.Firefox()
>>> driver.get('http://google.com')
>>> print(driver.page_source)
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" itemtype="http://schema.org/WebPage" itemscope=""><head><meta name="descri
...
:before,.vscl.vslru div.vspib{top:-4px}</style></body></html>
0
Bạn cũng có thể lấy nguồn trang HTML mà không cần sử dụng trình duyệt. Mô-đun yêu cầu cho phép bạn làm điều đó.
import requests
res = requests.get('https://google.com')
res.raise_for_status() # this line trows an exception if an error on the
# connection to the page occurs.
print(res.text)
Các vấn đề liên quan
- 1. Đợi chuyển hướng trang Selenium WebDriver (Python)
- 2. Nhập HTML ảnh hưởng đến toàn bộ trang
- 3. Cạo Toàn bộ Trang web
- 4. Làm cách nào để lấy nguồn HTML từ trang?
- 5. Khả năng in đầu trang/chân trang HTML
- 6. Python 2.7: In chủ đề an toàn
- 7. trang web cuộn sử dụng selen python webdriver
- 8. Cách chọn và thay thế toàn bộ trang bằng jQuery
- 9. Cách in mã trên HTML
- 10. jQuery Ajax trả về toàn bộ trang
- 11. html bảng span toàn bộ chiều rộng?
- 12. In toàn bộ số bằng {#} trong C#?
- 13. Kịch bản lệnh Python in mã nguồn của nó
- 14. Tải Toàn bộ trang web bằng C#
- 15. Selenium WebDriver: Cách đợi iFrames tải hoàn toàn?
- 16. Làm cách nào để in trang HTML ở chế độ ngang khi người dùng chọn 'in'?
- 17. Màu văn bản không chính xác khi in trang HTML
- 18. cách đặt màu nền của toàn bộ trang trong css
- 19. Cách in nguồn html vào bảng điều khiển với các phantomjs
- 20. Làm cách nào để hiển thị HTML bên trong trang Xamarin.Forms có nguồn HTML trong C#?
- 21. Xóa toàn bộ mảng Python
- 22. Cách trích xuất URL từ một trang HTML bằng Python
- 23. In trang HTML được định dạng trong C#
- 24. selenium-webdriver và đợi trang tải
- 25. Cách thêm thư mục trong An toàn nguồn?
- 26. Tìm xem liệu phần tử có tồn tại trong toàn bộ trang html
- 27. Làm mờ toàn bộ trang trong CSS
- 28. Selenium WebDriver chuyển đến trang mà không cần chờ tải trang
- 29. Cách xóa toàn bộ số lần xem trang bằng Tkinter
- 30. QWebEngine: in một trang?
Cảm ơn bạn, đây chính xác là những gì tôi cần! Đó là lỗi của tôi vì tôi đã làm điều này theo cách xấu 'print driver.page_source' (driver.page_source không nằm trong ngoặc vuông) – wmarchewka