cách ưa thích của tôi để làm điều này là:
docker run -it --rm --name chrome --shm-size=1024m --cap-add=SYS_ADMIN --entrypoint=/usr/bin/google-chrome-unstable yukinying/chrome-headless-browser --headless --disable-gpu --dump-dom https://www.facebook.com
Nếu bạn không quen thuộc với cách Docker hoạt động, kiên nhẫn - lần đầu tiên sẽ được làm chậm nhưng lời gọi tiếp theo sẽ nhanh chóng.
Thông tin khác
Thử nghiệm trên
Ubuntu 16
Linux intel-nuc 4.4.0-21-generiC#37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
Docker phiên bản:
Docker version 1.10.3, build 20f81dd
Mac OS X Sierra
Darwin MacBook-Pro.local 16.7.0 Darwin Kernel Version 16.7.0: Thu Jun 15 17:36:27 PDT 2017; root:xnu-3789.70.16~2/RELEASE_X86_64 x86_64 i386 MacBookPro14,3 Darwin
Docker phiên bản:
Docker version 17.06.1-ce, build 874a737
Nếu bạn cài đặt tidy
bạn có thể thụt HTML quá.
Nguồn
2017-09-19 21:35:14
Tôi đã làm điều này tại thời điểm đăng bài nhưng tôi nghĩ có một lý do không phải là giải pháp hoàn hảo. Tôi nghĩ rằng tôi muốn lưu trình xử lý sự kiện trên DOM mà kết xuất HTML không làm. – styfle
@styfle Không chắc tôi hiểu điều này. Khi bạn nhấn F12 nó là kết xuất (đúng từ ngữ?) HTML Tôi thấy, không phải là kết xuất cơ sở mà 'View Page Source' sẽ cung cấp cho bạn. Tôi theo lời khuyên của Damon và có mọi thứ tôi cần (một hộp chọn được điền bởi jquery). Nó vẫn là một cách tiếp cận rất vụng về, một trang Chọn Tất cả từ phần tử đơn giản sẽ trực quan hơn nhiều. –
Chỉ cần "Sao chép" thay vì "Sao chép dưới dạng HTML". Sau đó, chỉ cần dán vào Notepad. – Karlth