Về cơ bản tôi muốn làm giống như here được thực hiện bằng Python. Tôi muốn thay thế tất cả các thành phần tự đóng thành cú pháp dài.Đóng các thẻ XML mở bằng regex
Ví dụ
<iframe src="http://example.com/thing"/>
trở thành
<iframe src="http://example.com/thing"></iframe>
Full dụ:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<link rel="stylesheet" type="text/css" href="/sample.css">
<title></title>
<script type="text/javascript" src="/swfobject.js">
//void
</script>
<script type="text/javascript" language="JavaScript" src="/generate.js">
//void
</script>
<script type="text/javascript" language="JavaScript" src="/prototype.js">
//void
</script>
</head>
<body id="mediaPlayer" style="margin:0;padding:0;">
<script type="text/javascript">
swfobject.registerObject('id_G12564763');
function getFlashObject() {
var object;
if (navigator.appName == 'Microsoft Internet Explorer' || navigator.userAgent.indexOf("Chrome")!=-1)
{
object = document.getElementById('id_G12564763');
}
else
{
object = document['flash_id_G12564763'];
}
return object;
}
</script>
</body>
</html>
Lưu ý rằng http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 mô tả nghịch đảo của thao tác này. – Borealid
Borealid, tôi biết điều đó. Bạn có biết cách sửa lỗi này bằng trình phân tích cú pháp không? Theo như tôi nhớ, XML phải được định dạng tốt trước khi phân tích nó bằng một trình phân tích cú pháp. Đó chính là điều tôi cần làm. Tôi đã cố gắng Tidy, nhưng điều đó đã không làm việc và dự án không được duy trì nữa. Đây là một đầu ra html nhỏ mà chỉ đơn giản sẽ có một loạt các javascript bao gồm và thẻ nhúng đối tượng (flash). – user3111525