- Tôi có một 250MB + tập tin csv lớn để tải lên
- định dạng tập tin là
group_id, application_id, reading
và dữ liệu có thể trông giống như
1, a1, 0.1 1, a1, 0.2 1, a1, 0.4 1, a1, 0.3 1, a1, 0.0 1, a1, 0.9 2, b1, 0.1 2, b1, 0.2 2, b1, 0.4 2, b1, 0.3 2, b1, 0.0 2, b1, 0.9 ..... n, x, 0.3(lets say)
- Tôi muốn chia file dựa trên
group_id
, do đó, đầu ra phải là n tệp nơin=group_id
OutputCách tách tệp csv khổng lồ dựa trên nội dung của cột đầu tiên?
File 1 1, a1, 0.1 1, a1, 0.2 1, a1, 0.4 1, a1, 0.3 1, a1, 0.0 1, a1, 0.9
và
File2 2, b1, 0.1 2, b1, 0.2 2, b1, 0.4 2, b1, 0.3 2, b1, 0.0 2, b1, 0.9 .....
và
File n n, x, 0.3(lets say)
Tôi làm cách nào để thực hiện điều này một cách hiệu quả?
Are các hàng được sắp xếp bởi 'group_id'? – senderle
Dự kiến rằng id nhóm đã được sắp xếp chưa? – aweis