tôi cần cái gì đó để có thể lập trình và xử lý dấu chấm câu, dấu ngoặc vv
http://jsfiddle.net/AQvyd/
var wordToReplace = '買い手',
replacementWord = '[[BUYER]]',
text = 'Mange 買い手 information. The selected Store and Classification will be the default on the สั่งซื้อ.'
function replaceWord(text, wordToReplace, replacementWord) {
var re = new RegExp('(^|\\s|\\(|\'|"|,|;)' + wordToReplace + '($|\\s|\\)|\\.|\'|"|!|,|;|\\?)', 'gi');
return text.replace(re, replacementWord);
}
Tôi đã viết một trình soạn thảo tài nguyên javascript vì vậy đây là lý do tại sao tôi đã tìm thấy trang này và cũng trả lời nó ra khỏi sự cần thiết kể từ khi tôi không thể tìm thấy một từ biên parametarized regexp mà làm việc tốt cho Unicode.
Nguồn
2013-03-13 05:29:35
JavaScript không sử dụng 'UTF-8' cho Unicode. Theo tiêu chuẩn, việc triển khai có thể sử dụng 'UCS-2' hoặc' UTF-16' mà tôi tin. Điều này có nghĩa là bạn đang hoạt động trên văn bản đã được chuyển đổi sang một trong các định dạng này hoặc bạn có thể hoạt động trên văn bản, mỗi "octet" (byte) của mỗi codepoint Unicode đã được chuyển đổi thành một trong các định dạng này, tùy thuộc vào cách bạn mã nhận được văn bản. – hippietrail