Tôi có tệp bảng tính lớn (.xlsx) mà tôi đang xử lý bằng cách sử dụng gấu trúc python. Điều đó xảy ra là tôi cần dữ liệu từ hai tab trong tệp lớn đó. Một trong các tab có rất nhiều dữ liệu và một tab khác chỉ là một vài ô vuông.Sử dụng Pandas để pd.read_excel() cho nhiều trang tính của cùng một sổ làm việc
Khi tôi sử dụng pd.read_excel() trên bất kỳ bảng, có vẻ với tôi như toàn bộ tập tin được nạp (không chỉ là bảng Tôi quan tâm đến). Vì vậy, khi tôi sử dụng các phương pháp hai lần (một lần cho mỗi tờ), tôi có hiệu quả phải chịu toàn bộ bảng tính được đọc trong hai lần (mặc dù chúng tôi chỉ sử dụng tờ được chỉ định).
Tôi có sử dụng sai hoặc chỉ bị giới hạn theo cách này?
Cảm ơn bạn!
FWIW, nó trông giống như (lần cuối cùng tôi thử nghiệm nó) tải dòng đầu tiên trong * mọi *, vì vậy không có cách nào để hiệu quả kéo chỉ trong một trang tính, nhưng ít nhất nhận được nhiều trang tính không yêu cầu nhiều tải của toàn bộ trang tính. – HaPsantran
Câu trả lời này đã không được chấp nhận bởi gấu trúc và bây giờ bị treo cho tôi trong v0.21.0. Nó sẽ được thay thế bằng cái được đưa ra bởi @ Mat0kan. – DStauffman
@DStauffman Điều này vẫn hoạt động tốt đối với tôi và tôi không thấy dấu hiệu nào từ mã hoặc tài liệu mà điều này không được chấp nhận. Nếu bạn gặp rắc rối với nó, tôi sẽ gửi một vấn đề trên github cho gấu trúc hoặc xlrd (python excel phân tích thư viện được sử dụng bởi gấu trúc) – Noah