Tôi đang cố gắng tối ưu hóa một số phép tính bằng cách sử dụng các tập lệnh MMX và SSE với lắp ráp nội tuyến. Tuy nhiên, tôi đã không thể tìm thấy tài liệu tham khảo tốt cho timings và tập quán của các bộ hướng dẫn nâng cao. Bạn có thể vui lòng giúp tôi tìm tài liệu tham khảo có chứa thông tin về thông lượng, độ trễ, toán hạng và có lẽ mô tả ngắn về hướng dẫn không?Tham chiếu lệnh SSE và MMX ngắn gọn với độ trễ và thông lượng
Cho đến nay, tôi đã tìm thấy:
Intel Hướng dẫn Tham khảo Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2A và Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2B
Intel Tối ưu hóa Hướng dẫn http://www.intel.com/Assets/PDF/manual/248966.pdf
Thời gian của Integer Operations http://gmplib.org/~tege/x86-timing.pdf
Hướng dẫn Agner rất tuyệt. Chính xác những gì tôi cần. – Joe