trong một tĩnh mạch tương tự như câu hỏi này: stackoverflow: running-multiple-spiders-in-scrapyxây dựng scrapy nhện vào chương trình của riêng tôi, tôi không muốn gọi scrapy từ dòng lệnh)
tôi tự hỏi, tôi có thể chạy một toàn bộ dự án scrapy từ bên trong một chương trình python khác? Cho phép chỉ nói rằng tôi muốn xây dựng một chương trình toàn bộ mà yêu cầu cạo một số trang web khác nhau, và tôi xây dựng toàn bộ dự án phế liệu cho mỗi trang web.
thay vì chạy từ dòng lệnh dưới dạng một trong, tôi muốn chạy các trình thu thập thông tin này và lấy thông tin từ chúng.
Tôi có thể sử dụng mongoDB trong python ok, và tôi đã có thể xây dựng các dự án có chứa các trình thu thập dữ liệu, nhưng bây giờ chỉ cần hợp nhất tất cả vào một ứng dụng.
Tôi muốn chạy các ứng dụng một lần, và có khả năng kiểm soát nhiều nhện từ chương trình của riêng tôi
Tại sao làm điều này? cũng ứng dụng này cũng có thể kết nối với các trang web khác bằng cách sử dụng API và cần phải so sánh kết quả từ trang API với trang web được cạo trong thời gian thực. Tôi không muốn phải gọi điện thoại từ dòng lệnh, tất cả đều có nghĩa là tự chứa.
(Tôi đã được hỏi rất nhiều câu hỏi về cào thời gian gần đây, bởi vì tôi đang cố gắng để tìm ra giải pháp phù hợp để xây dựng ở)
Cảm ơn :)