2011-08-17 28 views
5

Tôi muốn tải một trang web và lưu nó bằng dòng lệnh (muốn có một hành vi tương tự mà chúng tôi nhận được để lưu trang như một trang đầy đủ trong firefox hoặc chrome.)Tạo một trang html và lưu nó bằng dòng lệnh

Tôi đã thử sử dụng wget và httrack, chúng cung cấp cho tôi các tệp html chính xác. Nhưng trong trường hợp của một html không đúng định dạng trình duyệt sửa chữa nó trong khi rendering và sử dụng lưu như trên có chúng tôi nhận được sửa chữa html nhưng điều này doesnot xảy ra trong trường hợp của wget hoặc htttrack.

Có công cụ nào sẽ hiển thị trang và lưu trang cùng với tất cả hình ảnh và flash và tất cả các nội dung khác ở địa phương hay không.

+0

Firefox có thể được sử dụng từ dòng lệnh. tuy nhiên tôi không thể có tùy chọn để lưu trang. Có ý tưởng gì không ...? –

Trả lời

2

Khi tôi muốn lưu trang để sử dụng ngoại tuyến, tôi sử dụng plugin Firefox có tên "Sổ lưu niệm". Điều đó, tất nhiên, không cho phép yêu cầu dòng lệnh của bạn. Nhưng nếu bạn sử dụng một công cụ như 'htmlunit' hoặc một cái gì đó như thế, bạn có thể lái xe trình duyệt Firefox để đi đến trang bạn muốn lưu.

0

Có một số phần mềm phức tạp có sẵn mà thực hiện chính xác rằng: https://launchpad.net/shotfactory

+0

này được sử dụng để chụp ảnh chụp màn hình mà không phải là một cái gì đó tôi đang tìm kiếm –

1

Bạn có thể sử dụng curl hoặc wget kết hợp với tidyhtml, tức là

curl http://stackoverflow.com > page.html 
    tidy page.html > page_clean.html 

Tidy sẽ có thể chuyển đổi bất kỳ đoạn mã HTML không hợp lệ để XTML hợp lệ.

+0

Nope thậm chí điều đó không giúp tôi .. –

1

Tôi không thể tìm thấy bất cứ điều gì khác vì vậy cuối cùng đã kết thúc mở trang trong firefox và bấm vào nút lưu dưới dạng và lưu nó .. Viết một kịch bản cho nó bằng cách sử dụng firefox và xdotools để tự động hóa toàn bộ tác vụ.

Cảm ơn bạn đã giúp đỡ và xem bạn bè.

1

Tôi cảm thấy cần phải có thứ gì đó tương tự như ngày hôm nay (và đã đi theo đường dẫn xdotool). Bạn có thể tìm thấy phiên bản của tôi (tập lệnh bash tái sử dụng) tại: https://github.com/abiyani/automate-save-page-as

Các vấn đề liên quan