Bộ nhớ hệ thống (RAM) được ánh xạ để truy cập GPU như thế nào? Tôi rõ ràng về cách bộ nhớ ảo hoạt động như thế nào cho CPU nhưng tôi không chắc chắn cách thức hoạt động của GPU khi GPU truy cập bộ nhớ hệ thống được ánh xạ GPU (máy chủ). Về cơ bản một cái gì đó liên quan đến cách dữ liệu được sao chép từ bộ nhớ hệ thống đến bộ nhớ máy chủ và ngược lại. Bạn có thể cung cấp giải thích được hỗ trợ bởi các bài viết tham khảo không?GPU - Ánh xạ bộ nhớ hệ thống
Trả lời
Tôi tìm thấy slideset sau khá hữu ích: HỆ THỐNG http://developer.amd.com/afds/assets/presentations/1004_final.pdf
NHỚ VỀ FUSION APU Lợi ích của Zero Sao chép Pierre Boudier AMD viên của OpenGL/OpenCL bán Graham AMD đốc OpenGL
Hội nghị thượng đỉnh dành cho nhà phát triển AMD Fusion Tháng 6 năm 2011
Lưu ý, tuy nhiên, đây là một bước chuyển nhanh rea. Không phát triển nhiều khái niệm mới, như trong (cuối cùng) áp dụng các khái niệm như bộ nhớ ảo cho GPU. Hãy để tôi tóm tắt.
Trong những ngày cũ, trước năm 2010, GPU thường là các bo mạch hoặc bo mạch PCI hoặc PCI-excpress riêng biệt. Họ đã có một số DRAM trên bo mạch GPU. DRAM trên tàu này khá nhanh. Họ cũng có thể truy cập DRAM ở phía CPU, thông thường thông qua các công cụ sao chép DMA trên PCI. Truy cập GPU vào bộ nhớ CPU như thế này thường khá chậm.
Bộ nhớ GPU không được phân trang. Đối với vấn đề đó, bộ nhớ GPU thường không được đính kèm, ngoại trừ phần mềm được quản lý lưu trữ bên trong GPU, giống như bộ đệm kết cấu. "Phần mềm được quản lý" nghĩa là các bộ đệm này không phải là bộ nhớ cache kết hợp và phải được xóa thủ công.
Thông thường, chỉ một phần nhỏ của DRAM CPU được truy cập bởi GPU - khẩu độ. Thông thường, nó đã được ghim - không phải phân trang. Thông thường, thậm chí không phải chịu dịch địa chỉ ảo - thường là địa chỉ ảo = địa chỉ thực, + có thể bù đắp một số.
(Tất nhiên, phần còn lại của bộ nhớ CPU là bộ nhớ ảo đúng, phân trang, chắc chắn đã dịch và được lưu vào bộ nhớ cache. Hệ thống con và hệ thống kết hợp bộ nhớ cache
Bây giờ, các công trình trên, nhưng đó là một cơn đau. thường có thể truy cập (chậm và không an toàn) tất cả các DRAM CPU, do đó có thể được phần mềm độc hại sử dụng,
AMD đã công bố mục tiêu tích hợp chặt chẽ các GPU và CPU. Một trong những bước đầu tiên là tạo APU "Fusion", các chip có chứa cả CPU và GPU. (Intel đã thực hiện tương tự với Sandybridge; tôi mong đợi ARM cũng làm như vậy.)
AMD cũng đã thông báo rằng họ có ý định sử dụng GPU sử dụng hệ thống con bộ nhớ ảo và sử dụng bộ đệm.
Một bước theo hướng có GPU sử dụng bộ nhớ ảo là AMD IOMMU. Intel cũng tương tự. Mặc dù IOMMUs hướng đến máy ảo nhiều hơn bộ nhớ ảo cho các hệ điều hành máy ảo.
Các hệ thống trong đó CPU và GPU nằm trong cùng một chip thường có quyền truy cập CPU và GPU cùng chip DRAM. Vì vậy, không còn DRAM "on-GPU-board" và "off-GPU - CPU".
Nhưng thường vẫn có một phân vùng, một phân vùng, của DRAM trên bo mạch hệ thống vào bộ nhớ chủ yếu được CPU sử dụng và bộ nhớ chủ yếu được GPU sử dụng. Mặc dù bộ nhớ có thể sống bên trong cùng một chip DRAM, thông thường một phần lớn là "đồ họa". Inthe giấy ở trên nó được gọi là "địa phương" bộ nhớ, vì lý do lịch sử. Bộ nhớ CPU và đồ họa có thể được điều chỉnh khác nhau - thông thường bộ nhớ GPU có mức ưu tiên thấp hơn, ngoại trừ việc làm mới video và có các thời lượng phát dài hơn.
Trong bài báo tôi giới thiệu cho bạn, có các bus nội bộ khác nhau: Hành động cho bộ nhớ "hệ thống" và "Tỏi" để truy cập nhanh hơn vào phân vùng bộ nhớ đồ họa. Bộ nhớ tỏi thường không bị cắt.
Bài báo tôi đề cập đến các cuộc trò chuyện về cách CPU và GPU có các bảng trang khác nhau. Phụ đề của họ, "lợi ích của bản sao không" đề cập đến ánh xạ một nhà cấu trúc dữ liệu CPU vào các bảng trang GPU, do đó bạn không cần phải sao chép nó.
Vv, v.v.,
Khu vực này của hệ thống đang phát triển nhanh chóng, vì vậy giấy 2011 gần như đã lỗi thời. Nhưng bạn nên lưu ý những xu hướng
(a) phần mềm muốn tiếp cận thống nhất để CPU và bộ nhớ GPU - bộ nhớ ảo và khả năng lưu nhớ
nhưng
(b) mặc dù phần cứng cố gắng để cung cấp (a), đồ họa đặc biệt bộ nhớ gần như luôn tạo ra bộ nhớ đồ họa chuyên dụng, ngay cả khi chỉ là một phân vùng của cùng một DRAM, nhanh hơn đáng kể hoặc tiết kiệm điện năng.
Khoảng cách có thể thu hẹp, nhưng mỗi lần bạn nghĩ rằng nó sắp sửa biến mất, bạn có thể chơi một mẹo phần cứng khác.
- 1. Tập tin ánh xạ bộ nhớ .NET
- 2. Zero, một ánh xạ bộ nhớ lớn với `madvise`
- 3. sự khác biệt giữa bộ nhớ ánh xạ io và io ánh xạ io
- 4. Trong hệ thống tệp FUSE bộ nhớ
- 5. Ưu điểm của tệp ánh xạ bộ nhớ là gì?
- 6. Cách mô phỏng ánh xạ bộ nhớ I/O
- 7. Giám sát các tệp ánh xạ bộ nhớ trong Windows
- 8. Tệp bộ nhớ được ánh xạ trên Windows
- 9. Các tệp ánh xạ bộ nhớ trong Java
- 10. bắt segfault, bộ nhớ không ánh xạ lỗi
- 11. Cách bộ nhớ được ánh xạ khi sử dụng nĩa?
- 12. Khó đọc từ Tập tin Ánh xạ Bộ nhớ
- 13. Linux Bộ nhớ ánh xạ tập tin dự trữ rất nhiều bộ nhớ vật lý
- 14. gọi hệ thống tới bộ nhớ bản đồ đến một bộ mô tả tệp (mmap ngược)?
- 15. như thế nào một chương trình chạy trong bộ nhớ và cách bộ nhớ được xử lý bởi hệ thống
- 16. Posix được chia sẻ bộ nhớ so với các tệp được ánh xạ
- 17. Làm thế nào để không đồng bộ tuôn ra một tập tin ánh xạ bộ nhớ?
- 18. Bộ nhớ phân bổ động trên GPU
- 19. Sử dụng bộ nhớ GPU progamatically
- 20. Chạy thư mục hệ thống tệp cục bộ làm đầu vào của Trình ánh xạ trong cụm
- 21. Hệ thống tệp trong bộ nhớ cho WIndows
- 22. Tổng mức tiêu thụ bộ nhớ của hệ thống
- 23. Giải thích hệ thống bộ nhớ đệm Magento
- 24. Bộ nhớ cache ánh xạ trực tiếp hoạt động như thế nào?
- 25. Bộ nhớ ánh xạ MappedByteBuffer hoặc ByteBuffer trực tiếp để thực hiện DB?
- 26. Hệ điều hành (POSIX) có xóa tệp ánh xạ bộ nhớ nếu quá trình này được SIGKILL không?
- 27. Bộ nhớ cache được ánh xạ trực tiếp Lượt truy cập/Miss
- 28. OLAP trong bộ nhớ có ưu điểm gì so với các hệ thống truyền thống có bộ nhớ đáng kể?
- 29. Lỗi hệ thống 0x5: CreateFileMapping()
- 30. Nhược điểm của ánh xạ quan hệ đối tượng