Tôi đoán câu hỏi này cần một số thông tin chi tiết về việc triển khai concat.là Pandas concat một chức năng tại chỗ?
Giả sử, tôi có 30 tệp, mỗi tệp 1G và tôi chỉ có thể sử dụng tối đa 32 bộ nhớ G. Tôi đã tải các tệp vào danh sách các DataFrames, được gọi là 'list_of_pieces'. List_of_pieces này phải có kích thước ~ 30G, phải không?
nếu tôi thực hiện 'pd.concat (list_of_pieces)', concat có phân bổ 30G khác (hoặc có thể 10G 15G) trong heap và thực hiện một số thao tác hay không.
có ai biết điều này không?
Cảm ơn!
Tôi không * nghĩ * nó ở chỗ ... như một sang một bên, tôi không nghĩ bạn thực sự muốn đọc nhiều vào bộ nhớ (bạn sẽ không để lại nhiều chỗ để thực sự tính toán)! Tôi nghĩ [cửa hàng HDF5] (http://pandas.pydata.org/pandas-docs/stable/io.html#hdf5-pytables) là lựa chọn tốt hơn cho bạn. –
@AndyHayden, tôi sợ tôi cần kích thước dữ liệu đó trong bộ nhớ, tôi cần một số phân tích tương tác trên chúng :-( –