Tôi có một tài liệu html và tôi muốn kéo các bảng ra khỏi tài liệu này và trả về chúng dưới dạng mảng. Tôi đang hình dung 2 chức năng, một hàm tìm tất cả các bảng html trong một tài liệu và một hàm thứ hai biến các bảng html thành các mảng 2 chiều.Cách chuyển đổi một bảng HTML thành một mảng trong python
Something như thế này:
htmltables = get_tables(htmldocument)
for table in htmltables:
array=make_array(table)
Có 2 sản lượng đánh bắt: 1. Các bảng số thay đổi ngày này sang ngày 2. Bảng dưới đây tất cả các loại định dạng thêm kỳ lạ, giống như tag in đậm và chớp, ném một cách ngẫu nhiên in.
Cảm ơn!
đẹp súp là rất tốt và dễ dàng! Ngoài ra, hãy thử sử dụng lxml + xpath nếu tìm thêm tốc độ. –
wow, hoạt động hoàn hảo. Cảm ơn bạn! – Zach
@user, luôn sẵn lòng trợ giúp.Nếu câu trả lời cho câu hỏi của bạn tốt, bạn nên "chấp nhận" câu hỏi đó (bằng cách nhấp vào biểu tượng dấu kiểm bên dưới số phiếu bầu ở góc trên bên trái) - đó là phần quan trọng trong nghi thức của SO! -) –