Giả sử rằng tôi có một số chuỗi: "Lorem ipsum dolor sit amet" Tôi cần một danh sách tất cả các từ có chiều dài hơn 3. Tôi có thể làm điều đó với biểu thức chính quy không?Danh sách tất cả các từ phù hợp với cụm từ thông dụng
ví dụ:
pattern = re.compile(r'some pattern')
result = pattern.search('Lorem ipsum dolor sit amet').groups()
kết quả chứa 'Lorem', 'ipsum', 'dolor' và 'amet'.
CHỈNH SỬA:
Từ mà tôi muốn nói chỉ có thể chứa chữ cái và số.
Bạn có nghĩa là kí tự ASCII, hoặc là chữ quốc tế như ký tự có dấu vv cũng có liên quan? –