2012-10-22 28 views
5

Xin vui lòng, giúp tôi viết một biểu thức chính quy cho các loại hình văn bản trong NotepadNotepad ++ thay thế biểu thức chính quy cho các ký tự hỗn hợp

Tôi có một văn bản với câu và từ Nga và Đức hỗn hợp, và tôi cần phải chèn trước câu trong thẻ tiếng Nga < "RUSSIAN"> và trước một câu trong thẻ tiếng Đức < "GERMAN">. Như thế này:

INPUT:

Текст на русском, раз два три, german text - русский текст: german text - some other german text русский текст = еще русский текст. Длинный текст на русском. A long text on german 

OUTPUT:

<"RUSSIAN">Текст на русском, раз два три, <"GERMAN">german text - <"RUSSIAN">русский текст: <"GERMAN">german text - some other german text <"RUSSIAN">русский текст = еще русский текст. Длинный текст на русском. <"GERMAN">A long text on german 

Tôi đoán nó có thể được thực hiện bằng cách nào đó bằng cách tìm kiếm

cyrillics ký tự như "А, а, Б, б, В, в, Г, г, Д, д, Е, е, Ё, ё, Ж, ж, З, з, И, и, Й, й, К, к, Л, л, М, м, Н, н, О, о, П, п, Р, р, С , с, Т, т, У, у, Ф, ф, Х, х, Ц, ц, Ч, ч, Ш, ш,, Щ, щ, Ъ, ъ, Ы, ы, Ь, ь, Э, э , Ю, ю, Я, я "

và các ký tự tiếng Đức như" A, a, B, b, C, c, D, d, E, e, F, g, g, H, h, I, i, J, j, K, k, L, l, M, m, N, n, O, o, P, p, Q, q, R, r, S, s, T, t, U, u, V, v, W, w, X, x, Y, y, Z, z, A, a, O, o, U, u ,? "

+0

dấu ngoặc kép trông đáng ngờ '<" voice required = "name = Alyona22k"> ' –

+0

Tôi đã thay đổi thẻ cần thiết để đơn giản hóa câu hỏi của mình ... –

+0

nó trông có vẻ lạ, nhưng ok, chấp nhận (không quan trọng để có được một câu trả lời) –

Trả lời

3

Dấu chấm câu & số làm cho điều này hơi khó hiểu nhưng bạn có thể khớp với bất kỳ ký tự Cyrillic nào & chụp cho đến khi ký tự Latinh;

Find: ([А-я].+?)([a-z])
Replace with: <ru>\1</ru>\2

Sau đó các ngôn ngữ khác là giữa </ru><ru>.

+0

Cảm ơn bạn Alex! Nó đã giúp! –

Các vấn đề liên quan