Tôi có một vài nghìn công việc để chạy trên một cụm slurm với 16 nút. Những công việc này chỉ nên chạy trên một tập hợp con của các nút có kích thước 7. Một số nhiệm vụ được song song, do đó sử dụng tất cả sức mạnh CPU của một nút trong khi một số khác là luồng đơn. Do đó, nhiều công việc nên chạy cùng một lúc trên một nút. Không có nhiệm vụ nào xuất hiện trên nhiều nút.slurm: sử dụng bất kỳ nút nào từ nodelist
Hiện nay tôi gửi mỗi công việc với:
sbatch --nodelist=myCluster[10-16] myScript.sh
Tuy nhiên tham số này làm cho slurm đợi cho đến khi công việc đệ trình chấm dứt, và do đó lá 3 nút hoàn toàn không sử dụng và tuỳ theo nhiệm vụ (đa hoặc đơn luồng), cũng là nút hiện đang hoạt động có thể chịu tải thấp về khả năng của CPU.
Các tham số tốt nhất của sbatch
là lực đẩy slurm để chạy nhiều công việc cùng một lúc trên các nút được chỉ định?
Giả sử bạn không phải là quản trị viên. Nếu không giới hạn và các hiệp hội là cách để đi. – damienfrancois
Với 'liên kết', bạn có nghĩa là 'đặt chỗ' trong từ vựng SLURM không? – Faber
Không, ý tôi là [liên kết] (http://slurm.schedmd.com/accounting.html) là thuật ngữ Slurm sử dụng trong ngữ cảnh tài khoản, chất lượng dịch vụ, phân vùng, v.v. để đặt giới hạn. – damienfrancois