Có cách nào để nhận jsoup để xóa chuỗi có HTML trong đó bằng cách thoát HTML không mong muốn thay vì xóa hoàn toàn không? ví dụ của tôi:Jsoup - Làm thế nào để xóa sạch html bằng cách thoát không xóa html không mong muốn?
String dirty = "This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
String clean = Jsoup.clean(dirty, new Whitelist().addTags("a").addAttributes("a", "href", "name", "rel", "target"));
này đưa ra một "sạch" chuỗi:
This is REALLY dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
Những gì tôi muốn là "sạch" chuỗi là:
"This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
Đẹp nhất. Không, Jsoup không ủng hộ nó. Bạn có thể muốn đăng yêu cầu tính năng tại https://github.com/jhy/jsoup/issues để thêm phương thức mới vào API 'Whitelist' có thể chuyển HTML thành HTML thoát. – BalusC
Yêu cầu tính năng đã đăng: https://github.com/jhy/jsoup/issues/515 –