Tôi đang tìm biểu thức chính quy trong Java khớp với tất cả các ký tự khoảng trắng trong một Chuỗi. "\ s" chỉ khớp với một số, nó không khớp với
và các khoảng trắng không phải ascii tương tự. Tôi đang tìm một biểu thức chính quy phù hợp với tất cả các ký tự khoảng trắng (phổ biến) có thể xuất hiện trong một chuỗi Java.Biểu thức chính quy Java để khớp với các ký tự khoảng trắng _all_
[Chỉnh sửa]
Để làm rõ: Tôi không có ý trình tự chuỗi "
" Ý tôi là nhân vật sincle unicode U + 00A0 mà thường được đại diện bởi "
", ví dụ trong HTML và tất cả các ký tự unicode khác có dấu cách không gian trắng tương tự, ví dụ: "NARROW NO-BREAK SPACE" (U + 202F), từ joiner được mã hóa trong Unicode 3.2 trở lên là U + 2060, "ZERO WIDTH NO-BREAK SPACE" (U + FEFF) và bất kỳ ký tự nào khác có thể được regareded như trắng- không gian.
[trả lời]
Đối pupose của tôi, tức là bắt tất cả các ký tự khoảng trắng, unicode + truyền thống, biểu thức sau đây không được công việc:
[\p{Z}\s]
Câu trả lời là trong các ý kiến dưới đây nhưng kể từ nó là một chút ẩn tôi lặp lại nó ở đây.
Để được rõ ràng, bạn có nghĩa ** nghĩa đen ** ' 'hoặc sản lượng của nó' \ u00A0'? Điều đó tạo nên sự khác biệt. – BalusC
's đầu ra? Đầu ra bởi cái gì? –
@Vinko: Trình duyệt web chẳng hạn. – BalusC