Tôi cần đọc một tệp lớn trong Scala và xử lý nó theo khối bit k (k có thể là 65536 thường). Như một ví dụ đơn giản (nhưng không phải là những gì tôi muốn):Đọc các tệp rất lớn (~ 1 TB) trong các khối liên tiếp
khối tệp là (f1, f2, ... fk)
.
tôi muốn để tính SHA256(f1)+SHA256(f2)+...+ SHA256(fk)
Như một tính toán có thể được thực hiện từng bước chỉ sử dụng lưu trữ liên tục và khối hiện tại mà không cần các khối khác.
Cách tốt nhất để đọc tệp là gì? (có lẽ một cái gì đó sử dụng tiếp tục?)
CHỈNH SỬA: Loại câu hỏi được liên kết giải quyết vấn đề nhưng không phải lúc nào, vì tệp tôi đang xem chứa dữ liệu nhị phân.
@Christian, Không, đây không phải lặp lại của câu hỏi được trích dẫn. – Biswanath
Tôi không thể hiểu điều này trùng lặp với câu hỏi được trích dẫn. Các câu hỏi khác nói về một tập tin csv dựa trên văn bản, câu hỏi này là đối phó với một "không phải văn bản dựa trên csv" tập tin. Câu trả lời của câu hỏi khác không nên áp dụng. Tôi thực sự nghi ngờ ai đã từng đánh dấu điều này là trùng lặp nếu họ đọc cả hai câu hỏi một cách đầy đủ. – Biswanath