Xin chào các bạn Tôi hy vọng chủ đề này đủ rõ ràng, tôi chưa tìm thấy bất cứ điều gì cụ thể về điều này trong thùng được yêu cầu trước đó. Tôi đã thử thực hiện điều này trong Perl hoặc Python, nhưng tôi nghĩ rằng tôi có thể đang cố gắng quá khó.Tách tệp txt lớn thành 200 tệp txt nhỏ hơn trên regex bằng cách sử dụng tập lệnh shell trong BASH
Có một lệnh/đường dẫn shell đơn giản sẽ tách tệp .txt 4MB của tôi thành các tệp .txt riêng biệt, dựa trên regex bắt đầu và kết thúc không?
Tôi cung cấp một mẫu ngắn của tệp bên dưới .. để bạn có thể thấy rằng mọi "câu chuyện" đều bắt đầu bằng cụm từ "X của XXX DOCUMENTS", có thể được sử dụng để chia nhỏ tệp.
Tôi nghĩ rằng điều này phải dễ dàng và tôi sẽ ngạc nhiên nếu bash không thể làm điều đó - nhanh hơn Perl/Py.
Ở đây là:
1 of 999 DOCUMENTS
Copyright 2011 Virginian-Pilot Companies LLC
All Rights Reserved
The Virginian-Pilot(Norfolk, VA.)
...
3 of 999 DOCUMENTS
Copyright 2011 Canwest News Service
All Rights Reserved
Canwest News Service
...
Cảm ơn trước cho tất cả sự giúp đỡ của bạn.
Ross
là nhiều văn bản mẫu cần thiết? – jakev
Vui lòng chỉnh sửa và xóa khoảng 95% văn bản trong câu hỏi của bạn. –
có thể trùng lặp của [Chia một tệp thành nhiều tệp dựa trên dấu phân tách] (http://stackoverflow.com/questions/11313852/split-one-file-into-multiple-files-based-on-delimiter) – tripleee