Tôi mới làm quen với khung làm việc và tôi đã xem một số hướng dẫn sử dụng LinkExtractors
và một số sử dụng SgmlLinkExtractor
. Tôi đã cố gắng tìm kiếm sự khác biệt/ưu điểm cho cả hai, nhưng kết quả đã không được thỏa mãn.Sự khác biệt giữa LinkExtractor và SgmlLinkExtractor
Ai đó có thể cho tôi biết sự khác biệt giữa cả hai? Khi nào chúng ta nên sử dụng các bộ tách trên?
Cảm ơn!
Đối với sự khác biệt, 'SgmlLinkExtractor' dựa trên [' sgmllib.SGMLParser'] (https://docs.python.org/2/library/sgmllib.html) (mô-đun 'sgml' không được dùng nữa kể từ Python 2.6 và không có sẵn trong Python3), trong khi 'LinkExtractor' mặc định được thực hiện trên đầu trang của' lxml', phần nào nhanh hơn và được duy trì tốt. –