Sự cố của tôi ở bên dưới nhưng sẽ là nhận xét quan tâm từ bất kỳ ai có kinh nghiệm với xlrd.Làm cách nào để đọc tệp Excel vào Python bằng xlrd? Nó có thể đọc các định dạng Office mới hơn không?
Tôi vừa tìm thấy xlrd và nó trông giống như giải pháp hoàn hảo nhưng tôi gặp vấn đề khi bắt đầu. Tôi đang cố gắng trích xuất dữ liệu theo chương trình từ tệp Excel mà tôi lấy từ Dow Jones với các thành phần hiện tại của Trung bình Công nghiệp Dow Jones (liên kết: http://www.djindexes.com/mdsidx/?event=showAverages)
Khi tôi mở tệp chưa sửa đổi Tôi nhận được lỗi BIFF khó chịu (định dạng nhị phân không công nhận)
Tuy nhiên bạn có thể nhìn thấy trong ảnh chụp màn hình này mà Excel 2008 cho Mac nghĩ rằng nó là trong 'Excel 1997-2004' định dạng (ảnh chụp màn hình: http://skitch.com/alok/ssa3/componentreport-dji.xls-properties)
Nếu tôi thay vì mở nó trong Excel bằng tay và save as ' Excel 1997-2004 'định dạng rõ ràng, sau đó mở trong python usig xlrd, mọi thứ đều tuyệt vời. Hãy nhớ rằng, Office cho rằng tệp đã có định dạng 'Excel 1997-2004'. Tất cả các file là .xls
Dưới đây là một pastebin của một phiên ipython tái tạo vấn đề: http://pastie.textmate.org/private/jbawdtrvlrruh88mzueqdq
Bất kỳ suy nghĩ về: Làm thế nào để đánh lừa xlrd thành công nhận các tập tin để tôi có thể trích xuất dữ liệu? Cách sử dụng python để tự động hóa định dạng 'lưu dưới dạng' rõ ràng thành định dạng mà xlrd sẽ chấp nhận? Gói B?
nope không kết hôn với xlrd. sẽ kiểm tra pyExcelerator bây giờ ... –
Có vẻ như không có nhiều tài liệu sẵn có cho pyExcelerator. Có thể bạn có thể chỉ cho tôi những điều cơ bản của việc mở một tập tin và trích xuất dữ liệu? –