2015-03-03 21 views
5

Tôi đang cố gắng gửi công việc tới SGE. Nó đã được làm việc cho tôi theo cùng một cách trong quá khứ. Thay vào đó, tất cả các công việc đều bị mắc kẹt trong trạng thái qw.SGE: Công việc bị kẹt ở trạng thái qw

"qstat -g c" đầu ra:

> CLUSTER QUEUE CQLOAD USED AVAIL TOTAL 
> all.q   0.38  0 160 1920 
> gpu6.q   -NA-  0  0  4  
> par6.q   0.38 750 135 1800  
> seq6.q   0.41 103 170 416 
> smp3.q   1.01  0  0  96 

"qstat" đầu ra trông như mọi khi.

Googling chỉ cho tôi gợi ý cho những người có quyền truy cập root mà tôi không có. Đề xuất bất kỳ ai?

Cảm ơn.

Chỉnh sửa: Công việc đã được gửi qua "qsub -q seq6.q scriptname" hoặc cách khác smp3.q hoặc par6.q.

"qstat -j jobid" cho không có gì đặc biệt như xa như tôi có thể thấy:

job_number:     2821318 
exec_file:     job_scripts/2821318 
submission_time:   Wed Mar 4 12:07:15 2015 
owner:      username 
uid:      31519 
group:      dch 
gid:      1150 
sge_o_home:     /home/hudson/pg/username 
sge_o_log_name:    username 
sge_o_path:     /gpfs/hamilton6/apps/intel_comp_2014/composer_xe_2013_sp1.2.144/bin/intel64:/usr/local/bin:/bin:/usr/bin:/usr/lpp/mmfs/bin:/usr/local/Cluster-Apps/sge/6.1u6/bin/lx24-amd64:/panfs/panasas1.hpc.dur.ac.uk/apps/nag/fll6a21dpl/scripts 
sge_o_shell:    /bin/tcsh 
sge_o_workdir:    /panfs/panasas1.hpc.dur.ac.uk/username/path 
sge_o_host:     hamilton1 
account:     sge 
mail_list:     [email protected] 
notify:      FALSE 
job_name:     scriptname 
jobshare:     0 
hard_queue_list:   seq6.q 
env_list:     
script_file:    scriptname 
scheduling info:   (Collecting of scheduler job information is turned off) 
+2

Bất kỳ thông tin chi tiết nào khi gọi "qstat -j "? –

+0

Đồng ý với Finch_Powers. Ngoài ra, vui lòng chỉnh sửa bài đăng bằng lệnh qsub và các tùy chọn được sử dụng. Rất khó để giải quyết thông tin này quá ít. – Vince

+0

Điều duy nhất tôi có thể nghĩ là ưu tiên của bạn đang bị hạ cấp xuống điểm chờ đợi, điều này không có ý nghĩa vì các vị trí có sẵn. Tôi sẽ nói chuyện với sysadmin của bạn để giúp bạn. – Vince

Trả lời

1

Tôi đã có cùng một vấn đề ngày hôm nay. Chúng tôi đang chạy Univa Grid Engine cho một khách hàng. Tôi đã cấu hình một số phức hợp để chạy các công việc đang yêu cầu nhiều bộ nhớ (h_stack = 64M, memory_free = 4G, virtual_free = 4G) trên máy chủ. Sau khi công việc cấu hình này sẽ treo trong hàng chờ. Cấu hình này phù hợp với nhiều năm với 3G trên tất cả các máy chủ thực thi của chúng tôi. Tôi sẽ kiểm tra cấu hình mới này (4G) ngày tiếp theo. Tất cả các máy chủ đều có đủ bộ nhớ! Ingo

Các vấn đề liên quan