Dường như nó không nhận ra Ó có dấu như hoaRegex cho chữ viết hoa Unicode không khớp với "Ó"?
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
lợi nhuận
SIM
Perl sẽ có thể sử dụng dữ liệu Unicode, mà đã thẻ Ó như hoa. Từ emacs describe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')
Tôi không thấy cách bạn có thể nhận được trường hợp tối thiểu _more_ so với những gì được cung cấp :-) – paxdiablo
Ah, lời xin lỗi của tôi, @pst. Tôi chỉ thực sự nhìn vào dòng _count_ chứ không phải là nội dung. Bạn đúng rằng bản thân RE có thể được đơn giản hóa. – paxdiablo