2012-03-02 46 views
9

Tải lượng công việc loại DSP nhất định dường như cho thấy cải thiện hiệu suất rất đáng kể trên bộ xử lý Intel x86 x86_64, khi được liên kết với thư viện Intel IPP.Có bất kỳ ARM tương đương với IPP của Intel không?

Tự hỏi liệu có điều gì đó tương tự ở phía ARM không? Đặc biệt là có thể làm việc trên ARM9, ARM11 và Cortex-A8/A9 (không nhất thiết với cùng một mức tăng hiệu suất).

Cuối cùng, câu hỏi sau đây, có thể không đúng/có thể chấp nhận ở đây, vì vậy, hãy sửa đổi để nhận xét và tôi có thể chỉnh sửa.

Tôi đã cố gắng đọc Thỏa thuận cấp phép của IPP, nhưng không rõ liệu giấy phép IPP thương mại trên Linux có bán 199 đô la Mỹ hay thuế hay không.) của thư viện, hoặc có thể liên kết ứng dụng của họ với thư viện này và bán nó cho lợi ích thương mại không? Hay điều đó cần một loại giấy phép khác? Không thể tìm ra một địa điểm trên trang web intel để đặt câu hỏi này (không có gì giống như Liên hệ bán hàng)!

Trả lời

6

Có một số câu trả lời cho câu hỏi của bạn, tùy thuộc vào cách bạn nhìn vào câu hỏi đó.

Intel IPP là thư viện có nhiều chức năng được nấu chín trước để thực hiện các tác vụ phổ biến như biến đổi nhanh-lỗi và như vậy. Có thư viện cụ thể trong cộng đồng mã nguồn mở mà làm như vậy, xem xét:

và nhiều mục khác. Không phải tất cả các thư viện đều có tối ưu hóa cho các lõi ARM khác nhau.

Góc thứ hai cho câu hỏi của bạn là lý do tại sao bạn muốn một cái gì đó hoạt động trên các lõi ARM khác nhau đáng kể. Trên Cortex Một bộ xử lý gia đình, bạn có (tùy chọn!) Lệnh ARM NEON SIMD (như MMX/SSE/AltiVec) có thể lấy một bộ dữ liệu cùng một lúc và áp dụng một số thao tác cho nó. Điều này làm giảm lượng hướng dẫn cần thiết để xử lý lượng dữ liệu. Dòng ARM11xx có thứ gì đó tương tự nhưng bị hạn chế nhiều hơn gọi là VFP3. Họ ARM9xx thực sự thiếu loại tối ưu hóa này. Ngoài ra, kiến ​​trúc ARM có Thumb và Thumb2 có thể dẫn đến mã nhỏ hơn và nhanh hơn.

Kết quả cuối cùng là các thư viện được tối ưu hóa thực sự chạy trên vô số lõi ARM, sẽ cần phải có một số triển khai cùng một thuật toán cho các tải công việc khác nhau. Điều này sẽ làm tăng kích thước thư viện. Bạn có sẵn sàng trả giá đó không?

4

Trên iOS có khung tăng tốc được tối ưu hóa cho ARM sử dụng SIMD nếu có. Xem tài liệu của Apple here.

+0

Thú vị. Chưa từng nghe về nó. Chắc chắn nó xứng đáng được xem xét. –

8

Ngoài ra còn có ARM sponsored dự án mã nguồn mở Ne10 ban đầu bao gồm một tập hợp nhỏ các dấu phẩy động, số học vectơ và các chức năng thao tác ma trận.

+0

Cảm ơn bạn đã tip-off! Trông có vẻ thú vị. – icarus74

Các vấn đề liên quan