Tôi muốn sử dụng gsub của R để xóa tất cả các dấu chấm câu khỏi một văn bản ngoại trừ các dấu nháy đơn. Tôi khá mới để regex nhưng đang học.Xóa tất cả các dấu chấm câu ngoại trừ dấu nháy trong R
Ví dụ:
x <- "I like %[email protected]*&, chew;: gum, but don't like|}{[] [email protected]#^)(gum!?"
gsub("[[:punct:]]", "", as.character(x))
Output Current (không dấu nháy đơn trong không)
[1] "I like to chew gum but dont like bubble gum"
Output mong muốn (Tôi mong muốn các dấu nháy đơn trong không ở lại)
[1] "I like to chew gum but don't like bubble gum"
Kay mã của bạn không xóa dấu nháy đơn. Đây là những gì tôi nghĩ rằng bạn có nghĩa là 'gsub (" [^ [: alnum:] [: không gian:] '\ "]", "", x) ' –
Tôi thích làm thế nào thẳng về phía trước mã hóa này là –
+1 - Ý tưởng ở đây chỉ là giải pháp rõ ràng nhất có thể, theo ý kiến của tôi, chỉ cần chỉnh sửa dòng thứ hai để đọc 'gsub (" [^ [: alnum:] [: dấu cách:] '] "," ", x)' và (FWIW, dấu gạch chéo ngược không cần thiết bên trong regex) –