Tôi đã một file XML với các nội dung:Khai thác dữ liệu từ một tập tin XML đơn giản
<?xml version="1.0" encoding="utf-8"?>
<job xmlns="http://www.sample.com/">programming</job>
Tôi cần một cách để trích xuất những gì có trong <job..>
</job>
thẻ, programmin trong trường hợp này. Điều này nên được thực hiện trên dấu nhắc lệnh linux, sử dụng grep/sed/awk.
Nếu tập tin XML của bạn chứa này: xml version = "1.0" encoding = "utf-8"> Tom & Jerry bạn muốn kết quả có XML thoát bỏ lại một mình: Tom & Jerry hoặc sẽ bạn muốn thoát được hoàn tác, như là một phân tích cú pháp XML sẽ: Tom & Jerry Nếu đó là thứ hai, xin lỗi, tôi không biết làm thế nào để làm điều đó với các công cụ văn bản Unix. –
@Paul 's/&/\ &/g', tương tự cho' " 'vv, tất nhiên nó sẽ không khái quát hóa cho các thực thể do người dùng xác định, v.v. – 13ren