Tôi không có vấn đề về mã cụ thể Tôi chỉ không chắc chắn cách tiếp cận vấn đề sau đây với khung làm việc Scrapy:Phế liệu: Theo liên kết để nhận dữ liệu Mặt hàng bổ sung?
Cấu trúc dữ liệu tôi muốn xóa thường là hàng bảng cho mỗi mục . Đủ đơn giản, đúng không?
Cuối cùng tôi muốn cạo Tiêu đề, Due Date và Chi tiết cho mỗi hàng. Tiêu đề và Due Date có sẵn ngay trên trang ...
NHƯNG Chi tiết mình đang không ở trong bảng - nhưng đúng hơn, một liên kết đến trang chứa các chi tiết (nếu điều đó không 't có ý nghĩa đây là một bảng):
|-------------------------------------------------|
| Title | Due Date |
|-------------------------------------------------|
| Job Title (Clickable Link) | 1/1/2012 |
| Other Job (Link) | 3/2/2012 |
|--------------------------------|----------------|
tôi sợ rằng tôi vẫn không biết làm thế nào để vượt qua hậu cần mục xung quanh với callbacks và yêu cầu, ngay cả sau khi đọc qua CrawlSpider phần của Scrapy tài liệu.
Có một mã số ví dụ cơ bản ở đâu? – fortuneRice
@fortuneRice, không chắc chắn nếu các ví dụ được cập nhật: http://stackoverflow.com/questions/11150053 http://stackoverflow.com/questions/13910357/how-can-i-use-multiple-requests-and -pass-items-in-between-them-in-scrapy-python/13911764 # 13911764 – warvariuc
đây là phần liên quan của tài liệu: http://doc.scrapy.org/en/latest/topics/spiders.html – tback