2016-03-18 14 views
5

Sau khi gửi một ứng dụng COMPS, tôi đã nhận được thông báo lỗi sau và ứng dụng không được thực thi.COMPSs - Các lỗi đã được điền đầy

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss 
--project=/tmp/1668183.tmpdir/project_1458303603.xml 
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml 
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc 
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc 

-------------------------------------------------------------------------- 
All nodes which are allocated for this job are already filled. 
-------------------------------------------------------------------------- 

Tôi đang sử dụng COMPSs 1.3.

Tại sao điều này lại xảy ra?

+0

Bạn có thể đăng thêm thông tin về lệnh nào bạn đã thực thi không? –

+0

Tôi đã chỉnh sửa câu hỏi của mình để bao gồm lệnh. –

Trả lời

5

Bạn đang cố gắng chạy chính và người lao động trong cùng một nút. COMPSs 1.3 tại cluster với bộ điều hợp NIO (tùy chọn mặc định) đang sử dụng mpirun để sinh ra các quy trình chủ và công nhân trong các nút khác nhau của cụm và mpirun được cài đặt trong cụm không cho phép thực hiện điều này.

Các tùy chọn để giải quyết nó như sau:

  1. Bạn không chỉ định --tasks_in_master = trong lệnh enqueue_compss.
  2. Bạn thực hiện với GAT Adapter (--comm = integratedtoolkit.gat.master.GATAdaptor) trong đó có nhiều overhead

Tiếp COMPSs phần mềm phát hành sẽ sử dụng lệnh spawn trong đó có sẵn trong các nhà quản lý tài nguyên cụm khác nhau (chẳng hạn như blaunch, srun) phải giải quyết vấn đề này

+2

Hoàn hảo! Tôi đã giải quyết được vấn đề của mình bằng Bộ điều hợp GAT. Tuy nhiên, vì tôi hiểu rằng bộ điều hợp NIO hiệu quả hơn, tôi sẽ cập nhật COMPS ngay khi bản phát hành tiếp theo được xuất bản. Cảm ơn phản hồi nhanh chóng và chính xác của bạn. –

Các vấn đề liên quan