tôi đang tìm kiếm text_
đó là: Tuần này (25 Tháng Ba - 31 tháng 3), tốc độ vận hành nhà máy lọc dầu trong nước tiếp tục giảm, tổng nhà máy dầu đậu nành trên toàn quốc đè bẹp 1.456.000 tấn (một bữa ăn 1.157.520 tấn, 262.080 tấn dầu), tuần trước ... [tiếp tục]Regex với chữ Hán
crush <- str_extract(string = text_, pattern = perl("(?<=量).*(?=吨(出粕)"))
meal <- str_extract(string = text_, pattern = perl("(?<=粕).*(?=吨,出)"))
oil <- str_extract(string = text_, pattern = perl("(?<=出油).*(?=吨))"))
in
[1] "1456000" ## correct
[1] "1157520" ## correct
[1] NA ## looking for 262080 here
Tại sao hai trận đấu đầu tiên nhưng không phải là người cuối cùng? tôi đang sử dụng các stringr
thư viện.
Sử dụng ' "(? <= dầu) \\ d + (? = t)"' để có được các chữ số giữa các chuỗi con mô hình thứ ba không hoạt động vì khung tròn là một. ASCII một, không phải là người Trung Quốc. –
Tuy nhiên trả về 'na' –
Xem https://regex101.com/r/1b1ucy/1 –