Trong môi trường python của tôi, các gói Rpy và Scipy đã được cài đặt.Python: xử lý một lượng lớn dữ liệu. Scipy hoặc Rpy? Và làm thế nào?
Vấn đề tôi muốn giải quyết là:
1) Tập dữ liệu tài chính khổng lồ được lưu trữ trong tệp văn bản. Không thể tải vào Excel
2) Tôi cần tổng hợp một số trường nhất định và nhận tổng số.
3) Tôi cần hiển thị 10 hàng hàng đầu dựa trên tổng số.
Gói nào (Scipy hoặc Rpy) phù hợp nhất cho tác vụ này?
Nếu có, bạn có thể cung cấp cho tôi một số gợi ý (ví dụ: tài liệu hoặc ví dụ trực tuyến) có thể giúp tôi triển khai giải pháp không?
Tốc độ là mối quan tâm. Lý tưởng là scipy và Rpy có thể xử lý các tệp lớn ngay cả khi các tệp quá lớn mà chúng không thể được lắp vào bộ nhớ
Bạn có thể tìm thấy một số thông tin hữu ích tại http://www.dabeaz.com/generators-uk/ – lazy1
'Tập hợp lớn' có ý nghĩa gì trong trường hợp của bạn? – radek