Làm cách nào để khớp một chữ cái từ bất kỳ ngôn ngữ nào bằng cách sử dụng regex trong python 3?Thư đối sánh bằng bất kỳ ngôn ngữ nào
re.match([a-zA-Z])
sẽ khớp với các ký tự ngôn ngữ tiếng Anh nhưng tôi muốn tất cả các ngôn ngữ được hỗ trợ cùng một lúc.
Tôi không muốn khớp với '
trong can't
hoặc gạch dưới hoặc bất kỳ loại định dạng nào khác. Tôi muốn regex của tôi phù hợp: c
, a
, n
, t
, Å
, é
và 中
.
Tôi không thể nghĩ ra một cách hợp lý để đi về việc này. Hầu hết các ngôn ngữ không khớp với bảng chữ cái tiếng Anh. Ví dụ, nếu bạn cố gắng để phù hợp với một 'k' trong tiếng Nhật, bạn sẽ không thể làm điều đó. Ngôn ngữ của họ chỉ chứa 'ka' 'ki' 'ku' 'ke' 'ko' nhưng chúng được biểu diễn bằng ký hiệu sao cho chữ K không khớp với bất kỳ ký tự cụ thể nào. Để làm việc này, về cơ bản bạn cần phải có một ngôn ngữ và "dịch" nó thành một tương đương tiếng Anh. Vì vậy, nếu bạn gặp "buổi sáng tốt" trong tiếng Nhật こ ん に ち は bạn sẽ phải "dịch" thành "konnichiwa" trước khi thực hiện một trận đấu regex. – Tony318
@ Tony318 tôi tình cờ đã học chuyên ngành tiếng Nhật ... Cách tiếp cận đó là sai trên rất nhiều cấp độ ... – ty812
thể trùng lặp của http://stackoverflow.com/questions/2039140/python-re-how-do-i- match-an-alpha-ký tự – Marty