2009-07-24 40 views
5

Chúng tôi đang đánh giá hiệu suất của HDF5 về các tập dữ liệu được chunked. Đặc biệt, chúng tôi cố gắng tìm hiểu xem liệu có thể đọc được các đoạn tiếp giáp khác nhau và hiệu suất bị ảnh hưởng như thế nào không? Ví dụ: chúng tôi có một tập dữ liệu với kích thước chunk 10, một tập dữ liệu với 100 giá trị và muốn đọc các giá trị từ 23 đến 48. Sẽ có mất mát lớn về hiệu suất không?Chunked HDF5 DataSet và slabsize

Rất cám ơn!

Trả lời

3

Tôi không biết cách trả lời cụ thể câu hỏi của bạn, nhưng tôi khuyên bạn nên sử dụng kích thước chunk 1024 (hoặc bất kỳ sức mạnh nào cao hơn của hai). Tôi không biết nội bộ của HDF5, nhưng từ kiến ​​thức của tôi về hệ thống tập tin, và từ một điểm chuẩn thô chúng tôi đã làm, 1024 là vừa phải.

+0

Cảm ơn rất nhiều câu trả lời của bạn! Tôi đã quan sát thấy rằng kích thước chunk chính nó là một yếu tố hiệu suất quan trọng. Như bạn đã đề cập, kích thước chunk> 1000 là điểm khởi đầu tốt. Những gì tôi cố gắng tìm ra là làm thế nào hiệu suất bị ảnh hưởng khi đọc dữ liệu tiếp giáp từ khối khác nhau. Nhưng tôi sợ rằng đây là một câu hỏi không thể được trả lời cụ thể. Vì vậy, chúng tôi sẽ phải thực hiện một số tiêu chuẩn. – usac