2013-07-26 46 views
6

Tôi đang cố gắng chỉ khớp với văn bản arabic bằng regex nhưng tôi nhận được một ngoại lệ. Dưới đây là mã của tôi:Kết hợp văn bản arabic với regex

txt.matches("\\P{Arabic}+") 

Dưới đây là những ngoại lệ:

ngoại lệ trong chủ đề java.util.regex.PatternSyntaxException "chính": nhân vật không rõ tên thuộc tính {} Ả Rập gần index 9 \ P {} Ả Rập +

Trả lời

11

Sử dụng nhân vật khối này

\p{InArabic}+ 

Trong java kịch bản Unicode, khối, chủng loại và tính nhị phân được viết với \p\P (hiệu lực phủ nhận)

  • Scripts được chỉ định bằng tiền tố Is hoặc bằng cách sử dụng các từ khóa script (supported scripts)
  • Blocks được chỉ định bằng tiền tố In hoặc bằng cách sử dụng từ khóa block (supported blocks)
  • Categorie s thể được chỉ định với tiền tố tùy chọn Is hoặc sử dụng từ khóa general_category hoặc gc (supported categories)
  • thuộc tính nhị phân được chỉ định với tiền tố Is (supported properties)

REFERECE

+0

tôi đang làm điều này với văn bản AA và nó trả về true! – Behnam

+0

@Campiador thats strange..can bạn dán mã bạn đang sử dụng để khớp? – Anirudha

+0

OK có thể xấu, tôi đã sử dụng P thay vì p, do sơ suất. – Behnam

Các vấn đề liên quan