Chúng tôi đang đánh giá hiệu suất của HDF5 về các tập dữ liệu được chunked. Đặc biệt, chúng tôi cố gắng tìm hiểu xem liệu có thể đọc được các đoạn tiếp giáp khác nhau và hiệu suất bị ảnh hưởng như thế nào không? Ví dụ: chúng tôi có một tập dữ liệu với kích thước chunk 10, một tập dữ liệu với 100 giá trị và muốn đọc các giá trị từ 23 đến 48. Sẽ có mất mát lớn về hiệu suất không?Chunked HDF5 DataSet và slabsize
Rất cám ơn!
Cảm ơn rất nhiều câu trả lời của bạn! Tôi đã quan sát thấy rằng kích thước chunk chính nó là một yếu tố hiệu suất quan trọng. Như bạn đã đề cập, kích thước chunk> 1000 là điểm khởi đầu tốt. Những gì tôi cố gắng tìm ra là làm thế nào hiệu suất bị ảnh hưởng khi đọc dữ liệu tiếp giáp từ khối khác nhau. Nhưng tôi sợ rằng đây là một câu hỏi không thể được trả lời cụ thể. Vì vậy, chúng tôi sẽ phải thực hiện một số tiêu chuẩn. – usac