Cụm từ thông thường chỉ cho phép các chữ cái là "[a-zA-Z]" nhưng tôi đến từ Thụy Điển, vì vậy tôi sẽ phải đổi chữ đó thành "[a- zåäöA-ZÅÄÖ] ". Nhưng giả sử tôi không biết chữ cái nào được sử dụng trong bảng chữ cái.Cụm từ thông dụng để bắt các chữ cái vượt quá az
Có cách nào để tự động biết những ký tự nào hợp lệ ở ngôn ngữ/ngôn ngữ cụ thể hay tôi chỉ cần tạo danh sách đen ký tự mà tôi nghĩ tôi không muốn?
Đối với những người không quá quen thuộc với regex (như tôi), mã đúng thực tế là: \ p {Ll} –
Để khớp các chữ cái sử dụng '\ p {L}'. Để khớp các chữ cái với dấu phụ, sử dụng '(?> \ P {L} \ p {M} *)'. Để khớp các chữ in hoa, sử dụng '\ p {Lu}'. Để khớp các chữ thường - có - sử dụng '\ p {Ll}'. –