Làm cách nào để xóa các ký tự, như dấu chấm câu, dấu phẩy, dấu gạch ngang, vv từ một chuỗi, theo cách an toàn nhiều byte?Regex để loại bỏ các ký tự không phải chữ và số từ các chuỗi UTF8
tôi sẽ làm việc với đầu vào từ nhiều ngôn ngữ khác nhau và tôi tự hỏi nếu có một cái gì đó có thể giúp tôi với điều này
Cảm ơn
Bạn muốn giữ chỉ 'một-z' và' 0-9'? Hoặc là tất cả các ký tự đặc biệt từ các ngôn ngữ khác nhau? – Marcus
giải thích lý do tại sao kết quả của tôi trong cách tiếp cận tốt hơn được đề xuất. –
@Marcus. Tôi cần giữ các ký tự unicode – Thomas