Trong ứng dụng của Ruby của tôi, tôi đã sử dụng phương pháp sau và biểu hiện thường xuyên để loại bỏ tất cả các thẻ HTML từ một chuỗi:Vấn đề với Regular Expression để Hủy bỏ Tag HTML
str.gsub(/<\/?[^>]*>/,"")
biểu thức chính quy này đã làm chỉ là về tất cả những gì đã mong đợi nó, ngoại trừ nó gây ra tất cả các dấu ngoặc kép được chuyển đổi thành “
và tất cả các dấu nháy đơn sẽ được thay đổi thành ”
.
Điều hiển nhiên tôi thiếu là chuyển đổi mã lộn xộn trở lại thành ký tự thích hợp của họ là gì?
Chỉnh sửa: Sự cố xảy ra có hoặc không có Biểu thức chính quy, vì vậy rõ ràng vấn đề của tôi không liên quan gì đến nó. Câu hỏi của tôi bây giờ là làm thế nào để đối phó với lỗi định dạng này và sửa nó. Cảm ơn!
Bạn đang sử dụng một số loại của "báo làm đẹp"? – Gumbo