Làm thế nào để thay thế tanween bel Alf với Alf bình thườngẢ Rập Vấn đề Thay أ chỉ với ا
Trả lời
Nhờ Bolo của enlightment sau một vài phút tìm kiếm tôi đã làm nó như thế:
string s = "";
foreach (Char c in x)
{
if (((int)c).ToString("x").ToLower() != "64b")
s += c.ToString();
}
trong đó x là chuỗi của tôi
Giống như là tôi loại trừ ARABIC FATHATAN từ chuỗi
Hãy nhìn vào dự án này cung cấp ví dụ về làm thế nào để thay thế các ký tự unicode trong chuỗi: http://www.codeproject.com/KB/string/FontGlyphSet.aspx
Xem thêm :
Tôi không biết C#, nhưng đó là câu hỏi của UNICODE. Tôi sẽ làm điều đó bằng phương tiện của UNICODE normalization, sử dụng this function.
Đầu tiên, chuẩn hóa thành biểu mẫu bị phân tách. Tiếp theo, lọc ra tất cả các ký tự từ danh mục "Đánh dấu, Không tìm kiếm" [Mn]. Cuối cùng, bình thường trở lại dạng sáng tác.
Nếu tôi thấy một cách chính xác, hình tượng của bạn được thể hiện trong UNICODE bởi ARABIC LETTER ALEF WITH HAMZA ABOVE
(U+0623, [Lo]) tiếp theo là ARABIC FATHATAN
(U+064B, [Mn]). Ký tự đầu tiên phân hủy thành ARABIC LETTER ALEF
(U+0627, [Lo]) + ARABIC HAMZA ABOVE
(U+0654, [Mn]).
Đây là chuỗi các biến đổi (mũi tên đầu tiên cho thấy một phân hủy, thứ hai - lọc ra Không giãn cách nhãn hiệu, thứ ba - một thành phần):
U+0623 + U+064B → U+0627 + U+0654 + U+064B → U+0627 → U+0627
Sau khi phân hủy, loại bỏ tất cả các nhân vật từ [Mn] danh mục và soạn lại, bạn chỉ còn lại ARABIC LETTER ALEF
.
Tôi sử dụng phương pháp này để xóa dấu phụ khỏi các văn bản được viết bằng bảng chữ cái Latinh. Tiếp theo, tôi cần xử lý một vài ngoại lệ, như 'Ł', nhưng phương pháp được mô tả bao gồm hầu hết các trường hợp. – Bolo
- 1. Mã hóa các từ tiếng Ả Rập bằng NLTK
- 2. Lỗi khi writting tiếng Ả Rập để hình ảnh
- 3. Gương Ả Rập về vấn đề bố cục trong Android
- 4. Ngôn ngữ Ả Rập Android
- 5. vấn đề với mệnh đề WHERE khớp với chuỗi tiếng Ả Rập
- 6. Solr cho tiếng Ả Rập
- 7. In chuỗi tiếng ả rập trong java
- 8. HTML Danh sách đặt hàng (ol) với số Ả Rập
- 9. Văn bản tiếng Ả Rập trong as3
- 10. Đạn Điểm Định vị với hướng RTL của Ả Rập
- 11. Xóa ký tự rác trong tiếng Ả Rập
- 12. Phân tích cú pháp XML tiếng Ả Rập trong Android
- 13. Sắp xếp các từ tiếng Ả Rập trong Java
- 14. Thư viện OCR nguồn mở cho tiếng Ả Rập
- 15. Trong Xcode, cách hiển thị văn bản hợp nhất tiếng Anh + tiếng Ả Rập và bắt đầu bằng tiếng Ả Rập?
- 16. Chèn & Chọn dữ liệu tiếng Ả Rập Android SQLite
- 17. Cách lấy bàn phím tiếng Ả Rập trong iphone sdk
- 18. Sử dụng Eclipse với tiếng Ả Rập và tiếng Anh trên cùng một dòng
- 19. Có cách nào để lưu trữ ngày tiếng Ả Rập với Postgres không?
- 20. Làm thế nào để chèn ký tự tiếng Ả Rập vào cơ sở dữ liệu sql?
- 21. Thiết kế giao diện người dùng cho ứng dụng Hỗ trợ tiếng Ả Rập trong Android
- 22. Bộ chọn ngày lịch Hijri (tiếng Ả Rập) sử dụng PHP hoặc Javascript
- 23. URDU hoặc Hỗ trợ tiếng Ả Rập trong Android cho trình giả lập và thiết bị
- 24. vấn đề với chỉ thị ngPattern
- 25. Vấn đề với chỉ mục jQuery()
- 26. Dải ký tự không phải chữ và số từ tiếng Ả Rập UTF8 + Chuỗi tiếng Anh
- 27. Cách xác định chuỗi là tiếng Anh hoặc tiếng Ả Rập?
- 28. Làm cách nào để chuyển đổi chữ số tiếng Anh sang chữ số Ả Rập?
- 29. Làm thế nào để làm cho cơ sở dữ liệu Mysql hỗ trợ ngôn ngữ tiếng Ả Rập?
- 30. vấn đề với DateTime.ToOADate()
Bất kỳ lý do nào muốn sử dụng regex cho điều này? –
Bạn có thể muốn cung cấp một số thông tin ngữ cảnh bổ sung như cách bạn lưu trữ chuỗi, v.v. –