Chỉ cần cố gắng tháo rời và cố gắng làm cho một con nhện cơ bản hoạt động. Tôi biết đây chỉ là một cái gì đó tôi đang thiếu nhưng tôi đã thử tất cả mọi thứ tôi có thể nghĩ đến.Phế liệu HtmlXPathSelector
Các lỗi tôi nhận được là:
line 11, in JustASpider
sites = hxs.select('//title/text()')
NameError: name 'hxs' is not defined
Mã của tôi là rất cơ bản vào lúc này, nhưng tôi vẫn dường như không thể tìm thấy nơi tôi sẽ sai. Cảm ơn vì bất kì sự giúp đỡ!
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
class JustASpider(BaseSpider):
name = "google.com"
start_urls = ["http://www.google.com/search?hl=en&q=search"]
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select('//title/text()')
for site in sites:
print site.extract()
SPIDER = JustASpider()
Làm thế nào để bạn chạy nhện? 'scrapy crawl" google.com "'? – Leo
Không có gì sai với mã của bạn (ngoài việc không cần phải khai báo SPIDER nữa), nó hoạt động cho tôi. –
@Leo Đó là cách tôi đã chạy nó. –