2015-12-14 16 views

Trả lời

3

Trình thu thập thông tin (scrapy.crawler) là điểm vào chính của Scrapy API. Nó cung cấp quyền truy cập vào tất cả các thành phần cốt lõi của Scrapy và nó được sử dụng để móc các chức năng mở rộng vào Scrapy.

Scraper (scrapy.core.scraper) thành phần chịu trách nhiệm phân tích cú pháp câu trả lời và trích xuất thông tin từ chúng. Nó đang được chạy từ Động cơ, và nó được sử dụng để chạy nhện của bạn.

scrapy.spiders là một mô-đun chứa cơ sở Spider thực hiện (mà bạn dùng để viết nhện của bạn), cùng với một số nhện thông thường có sẵn out of the box (như CrawlSpider cho bò ruleset-base, SitemapSpider cho sitemap dựa bò hoặc XMLFeedSpider để thu thập dữ liệu các nguồn cấp dữ liệu XML).

biết thêm thông tin có sẵn trên các trang tài liệu chính thức:
http://doc.scrapy.org/en/latest/topics/spiders.html?highlight=crawlspider#spiders http://doc.scrapy.org/en/latest/topics/api.html?highlight=scrapy.crawler#module-scrapy.crawler

+0

“phản ứng phân tích và thông tin giải nén”: là nhện đó? –

+0

Có, thành phần scraper chịu trách nhiệm chạy các trình thu thập thông tin. – bosnjak

Các vấn đề liên quan