Đã đấu tranh để xóa niqqud (dấu hiệu diacritical được sử dụng để biểu diễn nguyên âm hoặc phân biệt giữa cách phát âm thay thế của các chữ cái trong bảng chữ cái tiếng Do Thái). Tôi có ví dụ biến này: sample1 < - "הֻסְמַק"xóa tiếng Do Thái "niqqud" bằng r
Và tôi không thể tìm thấy cách hiệu quả để xóa các ký hiệu bên dưới các chữ cái.
thử Stringer, với str_replace_all(sample1, "[^[:alnum:]]", "")
thử gsub('[:punct:]','',sample1)
không thành công ... :-( bất kỳ ý tưởng?
Hãy xem [ví dụ về gsub của tôi] (http://ideone.com/1IxAeA), nó có phù hợp với bạn không? –
@stribizhev - cảm ơn bạn rất nhiều! nó hoạt động như một nét duyên dáng –
Bạn nên sử dụng thẻ [tag: hebrew]! cũng [tag: unicode] – smci