Tôi đang cố gắng gán một chuỗi văn bản Pháp hợp lệ để một chuỗi văn bản sử dụng lxml:Pháp và lxml văn bản
el = etree.Element("someelement")
el.text = 'Disponible à partir du 1er Octobre'
tôi nhận được lỗi:
ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters
Tôi cũng đã thử:
el.ext = etree.CDATA('Disponible à partir du 1er Octobre')
Tuy nhiên tôi cũng gặp lỗi tương tự.
Làm cách nào để xử lý tiếng Pháp trong XML, cụ thể là ISO-8859-1? Có nhiều cách để chỉ định mã hóa trong hàm tostring() trong lxml, nhưng không phải để gán giá trị văn bản trong các phần tử.
el.text = etree.CDATA (('Disponible à partir du 1er Octobre'). Decode ('utf-8')) hoặc el.text = ('Disponible à partir du 1er Octobre'). Decode (' utf-8 ') – shiva