Tôi có một danh sách lớn các tệp, một số tệp có ngày được nhúng trong tên tệp. Định dạng của các ngày không nhất quán và thường không đầy đủ, ví dụ: "Aug06", "Aug2006", "August 2006", "08-06", "01-08-06", "2006", "011004" vv Ngoài ra, một số tên tệp có số không liên quan trông hơi giống ngày, ví dụ "20202010".Trích xuất ngày không nhất quán được định dạng từ chuỗi (phân tích ngày, NLP)
Tóm lại, các ngày thường không đầy đủ, đôi khi không có, được định dạng không nhất quán và được nhúng trong một chuỗi với thông tin khác, ví dụ: "Báo cáo Aug06.xls".
Có bất kỳ mô-đun Perl nào có sẵn mà sẽ thực hiện công việc phong nha để đoán ngày từ chuỗi đó không? Nó không phải chính xác 100%, vì nó sẽ được xác minh bởi một người bằng tay, nhưng tôi đang cố gắng làm mọi thứ dễ dàng nhất có thể cho người đó và có hàng nghìn mục cần kiểm tra :)
Điều này phần nào tương tự như cách tôi đã làm nó cuối cùng, nhưng tôi lâu hơn, xấu xí và đáng sợ :) Tôi sẽ để câu hỏi mở ngay bây giờ, trong trường hợp ai đó ra khỏi đó đã gặp vấn đề trước đây, nhưng có vẻ như giống như một chút của một cuộn giải pháp của riêng bạn ... –
Câu trả lời của bạn về cơ bản là chính xác; dường như không có bất kỳ thư viện nào để làm điều này, bạn phải tự làm điều đó :) –