Làm cách nào để xóa các ký tự không phải UTF8 khỏi chuỗi ruby? Tôi có một chuỗi có ví dụ "xC2" trong đó. Tôi muốn loại bỏ char đó khỏi chuỗi sao cho nó trở thành một UTF8 hợp lệ.Xóa các ký tự không phải UTF khỏi một chuỗi trong Ruby?
này:
text.gsub!(/\xC2/, '')
trả về một lỗi:
incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)
tôi đang tìm kiếm tại text.unpack ('U *') và string.pack là tốt, nhưng đã không nhận được bất cứ nơi nào.
Bạn có thể tìm thấy http://stackoverflow.com/questions/11375342/stringencode-not-fixing-invalid-byte-sequence-in-utf-8-error/ hữu ích –