2012-07-16 38 views

Trả lời

55

Bạn có thể làm:

wget -r -l1 --no-parent http://www.domain.com/subdirectory/

nơi:

-r: recursive retrieving 
-l1: sets the maximum recursion depth to be 1 
--no-parent: does not ascend to the parent; only downloads from the specified subdirectory and downwards hierarchy 
+4

Cảm ơn bạn đã vi phạm các đối số lệnh. Tôi đã có một vấn đề tương tự nhưng chỉ cần các lệnh -r và --no-parent. – Sofox

+1

Nếu bạn muốn đảm bảo mỗi trang có thể được tải chính xác (ví dụ: tải xuống hình ảnh được tải trên các trang), bạn có thể thêm cờ ** - p ** vào lệnh trên. – earthmeLon

+0

Ngoài ra, thêm '-nd' để lưu các tệp trực tiếp trong thư mục hiện tại của bạn mà không có thư mục/path/to/the/subdirectory. – HenriV

5
$ wget -m -p -E -k -K -np {URL Address} 

Bạn có thể sử dụng man page để biết chi tiết các tùy chọn.

LƯU Ý: với các tùy chọn trước đó, chỉ mục tệp sẽ được tải xuống!

+0

Mất trí. Đúng những gì tôi đang tìm kiếm. Đây sẽ là câu trả lời được chấp nhận. –

+1

Giải pháp này không thành công trong trường hợp của tôi (GNU Wget 1.13.4 được xây dựng trên linux-gnu). Nó thực sự tải các tập tin trong thư mục cha mẹ --- không phải là kết quả mong muốn. –

+1

Trong trường hợp của tôi nó cũng không thành công. Có vẻ như 'wget' của tôi (GNU Wget 1.14) bỏ qua' --no-parent option'. Trong openSUSE nhảy 42.1.20160217 – boczniak767

2

Thông tin tốt mà tôi có thể sử dụng. Tôi đã thử:

 
wget -r -l1 --no-parent http://www.domain.com/subdirectory/ 

trên trang web có nhiều tệp có dạng name.subname.subname2.etc.htm hoặc .html. Để chọn những thứ này tôi đã chạy:

 
wget -r --no-parent http://www.domain.com/subdirectory/ 

và điều này làm việc tốt.

Các vấn đề liên quan