Tôi đang tìm cách phân tích nhanh các thẻ HTML ra khỏi chuỗi Coldfusion. Chúng tôi đang kéo một nguồn cấp dữ liệu RSS, có khả năng có bất kỳ thứ gì trong đó. Sau đó chúng tôi đang thực hiện một số thao tác thông tin và sau đó nhổ nó ra một nơi khác. Hiện tại chúng tôi đang làm điều này với một biểu thức chính quy. Có cách nào tốt hơn để làm điều này?Tôi làm cách nào để xóa các thẻ HTML khỏi chuỗi ColdFusion?
<cfloop from="1" to="#ArrayLen(myFeed.item)#" index="i">
<cfset myFeed.item[i].description.value =
REReplaceNoCase(myFeed.item[i].description.value, '<(.|\n)*?>', '', 'ALL')>
</cfloop>
Chúng tôi đang sử dụng ColdFusion 8.
Tôi đã tìm thấy <[^>] *> làm regex có thể sửa đổi. Lợi ích gì trong nửa thứ hai của bạn cung cấp? – Jason
Như tôi đã nói: Nó bắt các thẻ không được khép kín ở cuối chuỗi. "(?:> | $)" đọc dưới dạng "dấu ngoặc đơn đóng hoặc kết thúc chuỗi". Phần còn lại của regex tương đương với thay thế bạn đã tìm thấy. "[^>] *" thường được đề xuất nhiều hơn "(. | \ n) *?", bởi vì nó rõ ràng hơn và nhanh hơn. – Tomalak
Tôi khuyên bạn nên làm thẻ thứ hai để thay thế bằng >, vì bạn có thể có một số thức ăn thừa. – Kip