2012-07-06 55 views
8

Bộ nhớ hệ thống (RAM) được ánh xạ để truy cập GPU như thế nào? Tôi rõ ràng về cách bộ nhớ ảo hoạt động như thế nào cho CPU nhưng tôi không chắc chắn cách thức hoạt động của GPU khi GPU truy cập bộ nhớ hệ thống được ánh xạ GPU (máy chủ). Về cơ bản một cái gì đó liên quan đến cách dữ liệu được sao chép từ bộ nhớ hệ thống đến bộ nhớ máy chủ và ngược lại. Bạn có thể cung cấp giải thích được hỗ trợ bởi các bài viết tham khảo không?GPU - Ánh xạ bộ nhớ hệ thống

Trả lời

10

Tôi tìm thấy slideset sau khá hữu ích: HỆ THỐNG http://developer.amd.com/afds/assets/presentations/1004_final.pdf

NHỚ VỀ FUSION APU Lợi ích của Zero Sao chép Pierre Boudier AMD viên của OpenGL/OpenCL bán Graham AMD đốc OpenGL

Hội nghị thượng đỉnh dành cho nhà phát triển AMD Fusion Tháng 6 năm 2011

Lưu ý, tuy nhiên, đây là một bước chuyển nhanh rea. Không phát triển nhiều khái niệm mới, như trong (cuối cùng) áp dụng các khái niệm như bộ nhớ ảo cho GPU. Hãy để tôi tóm tắt.

Trong những ngày cũ, trước năm 2010, GPU thường là các bo mạch hoặc bo mạch PCI hoặc PCI-excpress riêng biệt. Họ đã có một số DRAM trên bo mạch GPU. DRAM trên tàu này khá nhanh. Họ cũng có thể truy cập DRAM ở phía CPU, thông thường thông qua các công cụ sao chép DMA trên PCI. Truy cập GPU vào bộ nhớ CPU như thế này thường khá chậm.

Bộ nhớ GPU không được phân trang. Đối với vấn đề đó, bộ nhớ GPU thường không được đính kèm, ngoại trừ phần mềm được quản lý lưu trữ bên trong GPU, giống như bộ đệm kết cấu. "Phần mềm được quản lý" nghĩa là các bộ đệm này không phải là bộ nhớ cache kết hợp và phải được xóa thủ công.

Thông thường, chỉ một phần nhỏ của DRAM CPU được truy cập bởi GPU - khẩu độ. Thông thường, nó đã được ghim - không phải phân trang. Thông thường, thậm chí không phải chịu dịch địa chỉ ảo - thường là địa chỉ ảo = địa chỉ thực, + có thể bù đắp một số.

(Tất nhiên, phần còn lại của bộ nhớ CPU là bộ nhớ ảo đúng, phân trang, chắc chắn đã dịch và được lưu vào bộ nhớ cache. Hệ thống con và hệ thống kết hợp bộ nhớ cache

Bây giờ, các công trình trên, nhưng đó là một cơn đau. thường có thể truy cập (chậm và không an toàn) tất cả các DRAM CPU, do đó có thể được phần mềm độc hại sử dụng,

AMD đã công bố mục tiêu tích hợp chặt chẽ các GPU và CPU. Một trong những bước đầu tiên là tạo APU "Fusion", các chip có chứa cả CPU và GPU. (Intel đã thực hiện tương tự với Sandybridge; tôi mong đợi ARM cũng làm như vậy.)

AMD cũng đã thông báo rằng họ có ý định sử dụng GPU sử dụng hệ thống con bộ nhớ ảo và sử dụng bộ đệm.

Một bước theo hướng có GPU sử dụng bộ nhớ ảo là AMD IOMMU. Intel cũng tương tự. Mặc dù IOMMUs hướng đến máy ảo nhiều hơn bộ nhớ ảo cho các hệ điều hành máy ảo.

Các hệ thống trong đó CPU và GPU nằm trong cùng một chip thường có quyền truy cập CPU và GPU cùng chip DRAM. Vì vậy, không còn DRAM "on-GPU-board" và "off-GPU - CPU".

Nhưng thường vẫn có một phân vùng, một phân vùng, của DRAM trên bo mạch hệ thống vào bộ nhớ chủ yếu được CPU sử dụng và bộ nhớ chủ yếu được GPU sử dụng. Mặc dù bộ nhớ có thể sống bên trong cùng một chip DRAM, thông thường một phần lớn là "đồ họa". Inthe giấy ở trên nó được gọi là "địa phương" bộ nhớ, vì lý do lịch sử. Bộ nhớ CPU và đồ họa có thể được điều chỉnh khác nhau - thông thường bộ nhớ GPU có mức ưu tiên thấp hơn, ngoại trừ việc làm mới video và có các thời lượng phát dài hơn.

Trong bài báo tôi giới thiệu cho bạn, có các bus nội bộ khác nhau: Hành động cho bộ nhớ "hệ thống" và "Tỏi" để truy cập nhanh hơn vào phân vùng bộ nhớ đồ họa. Bộ nhớ tỏi thường không bị cắt.

Bài báo tôi đề cập đến các cuộc trò chuyện về cách CPU và GPU có các bảng trang khác nhau. Phụ đề của họ, "lợi ích của bản sao không" đề cập đến ánh xạ một nhà cấu trúc dữ liệu CPU vào các bảng trang GPU, do đó bạn không cần phải sao chép nó.

Vv, v.v.,

Khu vực này của hệ thống đang phát triển nhanh chóng, vì vậy giấy 2011 gần như đã lỗi thời. Nhưng bạn nên lưu ý những xu hướng

(a) phần mềm muốn tiếp cận thống nhất để CPU và bộ nhớ GPU - bộ nhớ ảo và khả năng lưu nhớ

nhưng

(b) mặc dù phần cứng cố gắng để cung cấp (a), đồ họa đặc biệt bộ nhớ gần như luôn tạo ra bộ nhớ đồ họa chuyên dụng, ngay cả khi chỉ là một phân vùng của cùng một DRAM, nhanh hơn đáng kể hoặc tiết kiệm điện năng.

Khoảng cách có thể thu hẹp, nhưng mỗi lần bạn nghĩ rằng nó sắp sửa biến mất, bạn có thể chơi một mẹo phần cứng khác.

Các vấn đề liên quan