Tôi có regex sau chia tách trên bất kỳ dấu cách hoặc dấu câu nào. Làm cách nào để loại trừ 1 hoặc nhiều ký tự dấu câu từ :punct:
? Giả sử tôi muốn loại trừ dấu nháy đơn và dấu phẩy. Tôi biết tôi có thể sử dụng rõ ràng [all punctuation marks in here]
thay vì [[:punct:]]
nhưng tôi hy vọng một phương pháp loại trừ.Regex; loại trừ tất cả dấu chấm câu ngoại trừ
X <- "I'm not that good at regex yet, but am getting better!"
strsplit(X, "[[:space:]]|(?=[[:punct:]])", perl=TRUE)
[1] "I" "'" "m" "not" "that" "good" "at" "regex" "yet"
[10] "," "" "but" "am" "getting" "better" "!"
Đầu tôi đau ... –