Tôi có một tập tin văn bản với một điểm đánh dấu ở đâu đó ở giữa:chia thành hai sử dụng bash script
one
two
three
blah-blah *MARKER* blah-blah
four
five
six
...
Tôi chỉ cần chia nhỏ tập tin này trong hai tập tin, lần đầu tiên có chứa tất cả mọi thứ trước khi MARKER, và thứ hai chứa mọi thứ sau MARKER. Dường như nó có thể được thực hiện trong một dòng với awk hoặc sed, tôi chỉ không thể tìm ra cách.
Tôi đã thử một cách dễ dàng - sử dụng csplit, nhưng csplit không hoạt động tốt với văn bản Unicode.
Hầu như làm việc. Không vít lên UTF-8, nhưng lá * MARKER * trong tập tin thứ hai. –
Bạn đã thử giải pháp được hiển thị ở đây: http://www.unix.com/shell-programming-scripting/41060-split-file-into-seperate-files.html - Nó sử dụng 'csplit' và hoạt động theo cách bạn muốn , có nghĩa là, để cho các điểm đánh dấu ra các tập tin. –