Phần tử PythonTree có vẻ không sử dụng được với các không gian tên. Lựa chọn thay thế của tôi là gì? BeautifulSoup cũng khá là rác với không gian tên. Tôi không muốn xóa chúng ra.Trình phân tích cú pháp XML python tốt để làm việc với các tài liệu không gian tên lớn
Ví dụ về cách một thư viện python cụ thể nhận các phần tử không gian tên và bộ sưu tập của chúng là tất cả +1.
Chỉnh sửa: Bạn có thể cung cấp mã để xử lý trường hợp sử dụng thực tế này bằng thư viện bạn chọn không?
Làm thế nào bạn sẽ đi về nhận chuỗi 'Line Break', '2,6' và một danh sách [ 'PYTHON', 'XML', 'XML namespace']
<?xml version="1.0" encoding="UTF-8"?>
<zs:searchRetrieveResponse
xmlns="http://unilexicon.com/vocabularies/"
xmlns:zs="http://www.loc.gov/zing/srw/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:lom="http://ltsc.ieee.org/xsd/LOM">
<zs:records>
<zs:record>
<zs:recordData>
<srw_dc:dc xmlns:srw_dc="info:srw/schema/1/dc-schema">
<name>Line Break</name>
<dc:title>Processing XML namespaces using Python</dc:title>
<dc:description>How to get contents string from an element,
how to get a collection in a list...</dc:description>
<lom:metaMetadata>
<lom:identifier>
<lom:catalog>Python</lom:catalog>
<lom:entry>2.6</lom:entry>
</lom:identifier>
</lom:metaMetadata>
<lom:classification>
<lom:taxonPath>
<lom:taxon>
<lom:id>PYTHON</lom:id>
</lom:taxon>
</lom:taxonPath>
</lom:classification>
<lom:classification>
<lom:taxonPath>
<lom:taxon>
<lom:id>XML</lom:id>
</lom:taxon>
</lom:taxonPath>
</lom:classification>
<lom:classification>
<lom:taxonPath>
<lom:taxon>
<lom:id>XML-NAMESPACES</lom:id>
</lom:taxon>
</lom:taxonPath>
</lom:classification>
</srw_dc:dc>
</zs:recordData>
</zs:record>
<!-- ... more records ... -->
</zs:records>
</zs:searchRetrieveResponse>
Tôi yêu thiên nhiên meta của MWe của bạn. –
Sử dụng các từ khóa có liên quan trong mã ví dụ có nghĩa là nhiều người dùng hơn có thể tìm thấy câu hỏi và câu trả lời. –