Tôi đang cố gắng sử dụng httrack (http://www.httrack.com/) để tải xuống một trang duy nhất, không phải toàn bộ trang web. Vì vậy, ví dụ, khi sử dụng httrack để tải xuống www.google.com, nó chỉ nên tải xuống html được tìm thấy trong www.google.com cùng với tất cả các bảng định kiểu, hình ảnh và javascript và không theo bất kỳ liên kết nào đến images.google.com, labs.google.com hoặc www.google.com/subdir/ v.v.gương trang duy nhất với httrack
Tôi đã thử tùy chọn -w
nhưng điều đó không tạo ra bất kỳ sự khác biệt nào.
Lệnh nào đúng?
EDIT
tôi đã cố gắng sử dụng httrack "http://www.google.com/" -O "./www.google.com" "http://www.google.com/" -v -s0 --depth=1
nhưng sau đó nó sẽ không sao chép bất kỳ hình ảnh.
Điều cơ bản tôi muốn chỉ là tải xuống tệp chỉ mục của tên miền đó cùng với tất cả nội dung chứ không phải nội dung của bất kỳ liên kết bên ngoài hoặc bên trong nào.
wget sẽ là giải pháp dự phòng của tôi nếu httrack không thể thực hiện công việc. – Max
câu hỏi về 'httrack', vì vậy hãy đi đúng hướng. wget không thực thi JS – Toolkit
'wget' không thành công nếu tài nguyên có truy vấn. Nó tải xuống các tệp có tên với chuỗi truy vấn. –