Tôi có một chuỗi có nhiều giá trị ngày trong đó và tôi muốn phân tích tất cả chúng ra. Chuỗi là ngôn ngữ tự nhiên, vì vậy điều tốt nhất tôi đã tìm thấy cho đến nay là dateutil.Cách phân tích nhiều ngày từ một khối văn bản bằng Python (hoặc một ngôn ngữ khác)
Thật không may, nếu một chuỗi có nhiều giá trị ngày trong nó, dateutil ném một lỗi:
>>> s = "I like peas on 2011-04-23, and I also like them on easter and my birthday, the 29th of July, 1928"
>>> parse(s, fuzzy=True)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/pymodules/python2.7/dateutil/parser.py", line 697, in parse
return DEFAULTPARSER.parse(timestr, **kwargs)
File "/usr/lib/pymodules/python2.7/dateutil/parser.py", line 303, in parse
raise ValueError, "unknown string format"
ValueError: unknown string format
Bất kỳ suy nghĩ về cách để phân tích tất cả các ngày từ một chuỗi dài? Lý tưởng nhất, một danh sách sẽ được tạo ra, nhưng tôi có thể tự mình xử lý nếu tôi cần.
Tôi đang sử dụng Python, nhưng tại thời điểm này, các ngôn ngữ khác có thể là OK, nếu họ hoàn thành công việc.
PS - Tôi đoán tôi có thể phân tách đệ quy tệp đầu vào ở giữa và thử, thử lại cho đến khi nó hoạt động, nhưng đó là địa ngục.
Trong chuỗi mẫu của bạn, bạn đang xem "ngày phục sinh" là ngày bạn muốn phân tích cú pháp? – MattH
Không. Đã được thử nghiệm để xem nếu nó làm việc, nhưng tôi không quan tâm quá nhiều một trong hai cách. – mlissner
Với DateUtil 1.5 nó làm việc tất nhiên, xấu của tôi. Nhưng tôi vẫn muốn trao giải với cách tiếp cận sạch hơn/nhanh hơn MattH Shawn Chin ... – Dieter