Tôi cố gắng để phân tích cú pháp HTML với HtmlAgilityPack theo cách sau:Hủy bỏ khoảng trắng và ký tự dòng mới khi phân tích với HtmlAgilityPack
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(xhtmlString);
Thật không may là xhtmlString chứa khoảng trắng không cần thiết và ký tự xuống dòng, vì vậy _text của htmlDoc bây giờ trông như thế này :
<html xmlns=\"http://www.w3.org/1999/xhtml\">\n\t<head></head>\n\t<body>\n\n<p>Alle Auktionen<br /></p>\n\n\t</body>\n</html>
Đây là một vấn đề đối với tôi khi làm việc với các phần tử con của cơ thể.
Cách dễ nhất để xóa các ký tự không cần thiết này là gì?
HtmlAgilityPack có cung cấp một số loại chức năng để làm sạch HTML từ các dòng mới và các tab không?
Có cách nào bạn có thể sử dụng String.Replace để giải quyết này? –