2013-07-24 37 views
5

Tôi có một XML MS Excel (2003) tập tin với siêu dữ liệu sau:Đọc tệp MS Excel XML với khung dữ liệu pandas?

<?xml version="1.0" encoding="UTF-8"?> 
<?mso-application progid="Excel.Sheet"?><Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" 
xmlns:x="urn:schemas-microsoft-com:office:excel" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><OfficeDocumentSettings xmlns="urn:schemas-microsoft-com:office:office"> 

Tôi muốn đọc nó thành một dataframe gấu trúc. Một cách tốt để đi về việc này là gì? Cảm ơn.

+2

Có phải định dạng XML không? Nếu không thì bạn có thể đọc nó bằng cách sử dụng 'read_excel'. –

Trả lời

1

Bạn có thử Canopy python của pyxll, nó được quảng cáo là "Python cho Giải pháp Excel"

Kiểm tra nó ra xin và xem nếu nó giải quyết vấn đề của bạn.

Các vấn đề liên quan