Trên Intel Intrisics Guide đối với hầu hết các hướng dẫn, nó cũng có giá trị cho cả thời gian chờ và thông lượng. Ví dụ:Thông lượng thời gian chờ SIMD
__m128i _mm_min_epi32
Performance
Architecture Latency Throughput
Haswell 1 0.5
Ivy Bridge 1 0.5
Sandy Bridge 1 0.5
Westmere 1 1
Nehalem 1 1
chính xác gì những con số này nghĩa là gì? Tôi đoán độ trễ chậm hơn có nghĩa là lệnh mất nhiều thời gian hơn để thực thi, nhưng Thông lượng 1 cho Nehalem và 0.5 cho Ivy, nghĩa là lệnh nhanh hơn trên Nehalem?
Các lõi hiện đại có * hai * đơn vị thực thi có thể thực thi lệnh cùng một lúc. Vì vậy, nếu mặt trời chiếu sáng và bạn có gió ở phía sau và chương trình của bạn có hai trong số chúng gần nhau thì cả hai đều hoàn thành trong một chu kỳ. Làm cho nó nhìn vào hồ sơ của bạn mà họ đã mất một nửa chu kỳ. –