Làm thế nào để loại bỏ tất cả các ký tự đặc biệt trong một chuỗi đã cho trong R và thay thế mỗi ký tự đặc biệt bằng dấu cách?Xóa tất cả các ký tự đặc biệt khỏi chuỗi trong R?
Các ký tự đặc biệt để loại bỏ là: [email protected]#$%^&*(){}_+:"<>?,./;'[]-=
regex [:punct:]
sẽ làm cho một nửa của công việc.
Câu hỏi_2: Nhưng cách xóa ví dụ: các ký tự này từ tiếng nước ngoài: â í ü Â á ą ę ś ć
?
ANSWER_2: Thay thế [^[:alnum:]]
với [^a-zA-Z0-9]
trong regex
hoặc regexpr
:
regex[^a-zA-Z0-9]
Định nghĩa "ký tự đặc biệt" là gì? – kohske
Định nghĩa riêng của tôi sẽ là mọi ký tự không có trong Unicode ;-). Nhưng tôi đoán nhiều người khác sẽ không đồng ý. – Joey
Có thể xem các hàm 'sub' hoặc' gsub'. –