Tôi đang cố gắng lấy bất kỳ văn bản nào bên ngoài dấu ngoặc vuông bằng regex.regex để lấy tất cả văn bản bên ngoài dấu ngoặc đơn
Ví dụ chuỗi
Josie Smith [3996 TRƯỜNG CAO ĐẲNG AVENUE, SOMETOWN, MD 21.003] Mugsy Chó Smith [2560 OAK ST, GLENMEADE, WI 14.098]
Tôi có thể để nhận được văn bản bên trong dấu ngoặc vuông thành công với:
addrs = re.findall(r"\[(.*?)\]", example_str)
print addrs
[u'3996 COLLEGE AVENUE, SOMETOWN, MD 21003',u'2560 OAK ST, GLENMEADE, WI 14098']
nhưng tôi gặp sự cố khi nhận bất kỳ thứ gì bên ngoài trong số các dấu ngoặc vuông. Tôi đã thử một cái gì đó như sau:
names = re.findall(r"(.*?)\[.*\]+", example_str)
nhưng mà chỉ thấy tên đầu tiên:
print names
[u'Josie Smith ']
Cho đến nay tôi đã chỉ nhìn thấy một chuỗi chứa 1-2 name [address]
combo, nhưng tôi m giả sử có thể có bất kỳ số nào trong số chúng trong một chuỗi.
các ngoặc vuông có thể được lồng nhau – aaronman
@aaronman Tôi giả định rằng sẽ KHÔNG có bất kỳ dấu ngoặc ôm nào. câu hỏi hay. – Banjer