Tôi muốn viết một loạt các tối ưu hóa cho gcc bằng thuật toán di truyền. Tôi cần đo thời gian thực hiện của một chức năng lắp ráp cho một số chỉ số và chức năng phù hợp. Không thể sử dụng phép đo thời gian thông thường, vì nó bị ảnh hưởng bởi kích thước bộ nhớ cache.
Vì vậy, tôi cần một bảng nơi tôi có thể thấy một cái gì đó như thế này.Làm thế nào để đo thời gian thực thi lệnh x86 và x86-64 trong các chu kỳ xử lý?
command | operands | operands sizes | execution cycles
Tôi có hiểu nhầm điều gì đó không? Xin lỗi vì tiếng Anh xấu.
Tiếng Anh của bạn vẫn ổn. Tôi không biết ngày nào sẽ đến khi những người tìm kiếm một vài phần trăm tăng tốc thông qua tối ưu hóa vi mô cũng sẽ hiểu giá trị của việc nhận được nhiều yếu tố tăng tốc thông qua tối ưu hóa macro, mà trình biên dịch không thể làm được. –
Có thể trùng lặp [Cần bao nhiêu chu kỳ CPU cho mỗi lệnh lắp ráp?] (Http://stackoverflow.com/questions/692718/how-many-cpu-cycles-are-needed-for-each-assembly-instruction) –