Tôi có tệp CSV có nhiều cột được sắp xếp. Ví dụ: tôi có thể có các dòng như sau:chia nhỏ tệp văn bản csv dựa trên giá trị cột
19980102,,PLXS,10032,Q,A,,,15.12500,15.00000,15.12500,2
19980105,,PLXS,10032,Q,A,,,14.93750,14.75000,14.93750,2
19980106,,PLXS,10032,Q,A,,,14.56250,14.56250,14.87500,2
20111222,,PCP,63830,N,A,,,164.07001,164.09000,164.12000,1
20111223,,PCP,63830,N,A,,,164.53000,164.53000,164.55000,1
20111227,,PCP,63830,N,A,,,165.69000,165.61000,165.64000,1
Tôi muốn chia tệp dựa trên cột thứ 3, ví dụ: đặt các mục PLXS và PCP vào các tệp riêng của chúng được gọi là PLXS.csv và PCP.csv. Bởi vì tệp xảy ra được sắp xếp trước, tất cả các mục PLXS trước các mục nhập của PCP và vân vân.
Tôi thường làm những việc như thế này trong C++ vì đó là ngôn ngữ tôi biết rõ nhất, nhưng trong trường hợp này, tệp CSV đầu vào của tôi là vài gigabyte và quá lớn để tải vào bộ nhớ trong C++.
Ai đó có thể cho biết cách thực hiện điều này? Perl/Python/php/bash giải pháp là tất cả okay, họ chỉ cần để có thể xử lý các tập tin lớn mà không cần sử dụng bộ nhớ quá mức.
có bạn đã duyệt qua xung quanh ở tất cả? một số câu hỏi liên quan trên trang web này bằng tất cả các ngôn ngữ trên và hơn thế nữa. bạn có thể tìm kiếm: 'site: stackoverflow.com csv chia theo giá trị' hoặc một số biến thể như vậy. best of luck – bernie