Tôi đã viết chương trình xử lý tệp và giờ nó cần đọc từ tệp được nén (tệp .gz đã giải nén có thể lớn tới 2TB),Sử dụng sed trên một tệp nén
Có một sed tương đương cho nén file như (zcat/mèo) hoặc nếu không những gì sẽ là phương pháp tốt nhất để làm những việc sau một cách hiệu quả
ONE=`zcat filename.gz| sed -n $counts`
$ đếm: truy cập để đọc (từng dòng)
các phương pháp trên hoạt động, nhưng là khá làm chậm tệp lớn vì tôi cần phải đọc từng dòng và thực hiện khớp trên một số trường nhất định.
Cảm ơn
EDIT
Mặc dù không trực tiếp giúp đỡ, đây là một tập hợp các zcommands
http://www.cyberciti.biz/tips/decompress-and-expand-text-files.html
Làm việc trên tệp nén sẽ chậm. – Nobody
Ý kiến của tôi là giải nén một tệp và đọc qua một đường ống ** là ** cách hiệu quả nhất để tạm thời mở tệp đã nén và nhận kết quả. Bạn không cần phải dành thời gian rezipping các tập tin khi bạn đang thực hiện. Nó có nhiều khả năng bạn có thể cải thiện hiệu quả của hoạt động tổng thể của bạn bằng cách chắc chắn mã 'sed' của bạn được tối ưu hóa hoàn toàn HOẶC nhiều khả năng sử dụng một trong những awk, perl, python để làm phép tính của bạn. Chúc may mắn. – shellter
cảm ơn .. nếu không nén, kích thước tệp sẽ vượt qua 2TB .. do đó không khả thi đối với cơ sở hạ tầng của tôi .. – learner