Tôi đang tìm cách tách một tệp XML lớn thành các bit nhỏ hơn. Tôi muốn quét qua các tập tin tìm kiếm một thẻ cụ thể, sau đó lấy tất cả các thông tin giữa và, sau đó lưu nó vào một tập tin, sau đó tiếp tục thông qua phần còn lại của tập tin.Tách một tệp XML lớn trong Python
Vấn đề của tôi đang cố gắng tìm một cách sạch sẽ cần lưu ý khi bắt đầu và kết thúc của thẻ, để tôi có thể lấy các văn bản bên trong như tôi quét qua các tập tin với "cho dòng trong f"
tôi d thay vì không sử dụng các biến sentinel. Có cách nào để thực hiện điều này không?
Tệp quá lớn để đọc vào bộ nhớ.
Hãy thử http://stackoverflow.com/search?q=iterparse – jfs
nếu bạn sử dụng Jython và 64bit JVM, bạn có thể sử dụng mở rộng VTD-xml để làm tách, thanh lịch nhất/đơn giản/hiệu quả loại –