Tôi muốn có lời khuyên/trợ giúp của bạn về cách tập hợp một tệp lớn (hàng triệu hàng hoặc đường).cách đặt tập tin - chọn một số hàng hoặc cột
Ví dụ,
(1) Tôi có tập tin lớn (hàng triệu dòng, tab-delimited). Tôi muốn tập hợp con của tệp này chỉ có các hàng từ 10000 đến 100000.
(2) Tôi có tệp lớn (hàng triệu cột, phân tách bằng tab). Tôi muốn một tập hợp con của tệp này chỉ có các cột từ 10000 đến 100000.
Tôi biết có các công cụ như đầu, đuôi, cắt, tách và awk hoặc sed. Tôi có thể sử dụng chúng để làm việc đơn giản. Nhưng, tôi không biết làm thế nào để thực hiện công việc này.
Bạn có thể đưa ra lời khuyên nào không? Cảm ơn trước.
+1 đây là câu trả lời đơn giản nhất mà tôi có thể nghĩ đến. Nhưng con mèo không được yêu cầu ở đây.chúng tôi có thể làm điều này mà không cần cat.'awk 'NR> = 10000 && NR <= 100000 {print}' largefile' và 'cut -d '\ t' -f 10000-100000 largefile' – Vijay
@Rahul Dravid: cảm ơn, tôi sẽ thêm nó – Drakosha
Bạn có thể rút ngắn tệp đầu tiên thành:' awk 'NR> = 10000 && NR <= 100000 'tệp lớn', đó là một quy trình ít hơn và hành động mặc định của awk sẽ được in nếu phạm vi đánh giá là đúng. Nhưng đó là slurps các dòng afters 100000 cho không có gì, vì vậy tốt hơn viết nó như: 'awk 'NR> 100000 {exit} NR> = 10000 && NR <= 100000' largefile' như cách xử lý sẽ dừng lại trên dòng 100001st. –