Tôi đang sử dụng regex này:Chuỗi chia, lời nói bao gồm cả ký tự có dấu
x.split("[^a-zA-Z0-9']+");
này trả về một mảng các chuỗi với chữ cái và/hoặc số.
Nếu tôi sử dụng này:
String name = "CEN01_Automated_TestCase.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
tôi nhận:
CEN01
Automated
TestCase
Java
Nhưng nếu tôi sử dụng này:
String name = "CEN01_Automação_Caso_Teste.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
tôi nhận:
CEN01
Automa
o
Caso
Teste
Java
Làm cách nào để sửa đổi regex này để bao gồm các ký tự có dấu trọng âm? (á, ã, õ, vv ...)
Nếu Java hỗ trợ các thuộc tính unicode '[^ \ p {L}]' sẽ khá mạnh mẽ. Không biết nếu nó mặc dù ... – Wrikken
@ Wrikken: Nó có. Java 7 thậm chí còn hỗ trợ '\ w' và' \ b' theo cách hợp lý Unicode. –
Rất tốt, tôi chỉ lười nhác để tìm kiếm nó, nhưng được ghi nhận hợp lệ;) – Wrikken