Tôi muốn xóa thẻ HTML khỏi chuỗi. này rất dễ dàng, tôi biết, tôi đã làm như vậy:Xóa một số thẻ HTML bằng RegExp và Java
public String removerTags(String html)
{
return html.replaceAll("\\<(/?[^\\>]+)\\>", " ").replaceAll("\\s+", " ").trim();
}
Vấn đề là tôi không muốn để loại bỏ tất cả các thẻ .. Tôi muốn tag
<span style=\"background-color: yellow\"> (text) </ span>
nghỉ còn nguyên vẹn trong chuỗi ..
tôi đang sử dụng điều này như một loại "nổi bật" trong việc tìm kiếm một ứng dụng web sử dụng GWT tôi đang làm ...
Và tôi cần phải làm điều này, bởi vì nếu tìm kiếm tìm thấy te xt có chứa một số thẻ HTML (việc lập chỉ mục được thực hiện bởi Lucene), và nó bị hỏng, appendHTML từ safeHTMLBuilder không thể gắn một String.
Bạn có thể làm điều này theo cách khá tốt?
Hugs.
Những câu hỏi rất thường xuyên những ngày này. Tại sao chúng ta không thể nhóm các câu hỏi tương tự lại với nhau? * # SO tip *;) –
đó là người đàn ông đích thực. – caarlos0
Đảm bảo bạn cũng tính đến các giá trị tham chiếu đối tượng. – Edward