Tôi muốn sử dụng gói nhanh nhẹn HTML để phân tích các bảng từ các trang web phức tạp, nhưng bằng cách nào đó tôi bị mất trong mô hình đối tượng.HTML Agility pack - các bảng phân tích cú pháp
Tôi đã xem ví dụ về liên kết nhưng không tìm thấy bất kỳ dữ liệu bảng nào theo cách này. Tôi có thể sử dụng XPath để lấy các bảng không? Tôi về cơ bản bị mất sau khi tải dữ liệu về cách lấy các bảng. Tôi đã làm điều này trong Perl trước và nó hơi vụng về, nhưng đã làm việc. (HTML::TableParser
).
Tôi cũng rất vui nếu người ta chỉ có thể làm sáng một thứ tự đúng đối tượng để phân tích cú pháp.
Xin chào Mark, bạn có thể xin lời khuyên về phân tích các tệp lớn không? Hơn 50 mb tệp, tôi không thể tìm nạp các nút con trên các tệp lớn hơn –
@Marc - nếu bảng đang phân trang, sau đó làm cách nào để truy cập trang tiếp theo bằng cách cạo? –
@Dark_Knight bạn cần nhấn bất kỳ tuyến đường ajax nào mà trang gốc đã sử dụng –