2011-10-24 36 views
7

Tôi đã chạy Nagios khoảng hai năm, nhưng gần đây vấn đề này bắt đầu xuất hiện với một trong các dịch vụ của tôi.Nagios: CRITICAL - Hết thời gian chờ sau 10 giây

Tôi nhận được

CRITICAL - Socket timeout after 10 seconds 

để kiểm tra check_http -H my.host.com -f follow -u /abc/def, mà sử dụng để hoạt động tốt. Không có dịch vụ nào khác đang báo cáo sự cố này. Các trang web từ xa là lên và khỏe mạnh, và tôi có thể làm một wget http://my.host.com/abc/def từ máy chủ Nagios, và nó tải các phản ứng tốt. Ngoài ra, việc thực hiện check_http -H my.host.com -f follow chỉ hoạt động tốt, tức là chỉ khi tôi sử dụng đối số -u thì mọi thứ sẽ bị hỏng. Tôi cũng đã thử chuyển nó qua một chuỗi tác nhân người dùng khác, không có sự khác biệt. Tôi đã thử tăng thời gian chờ, không may mắn. Tôi đã thử với -v, nhưng tất cả những gì có được là:

GET /abc/def HTTP/1.0 
User-Agent: check_http/v1861 (nagios-plugins 1.4.11) 
Connection: close 
Host: my.host.com 


CRITICAL - Socket timeout after 10 seconds 

... không cho tôi biết điều gì đang xảy ra.

Bất kỳ ý tưởng nào về cách tôi có thể giải quyết vấn đề này?

Cảm ơn!

+0

Bạn đã thử thêm '-4' hoặc '-6' với các tùy chọn check_http? Tôi đã có vấn đề này trước khi tôi buộc phải kiểm tra IPv4. – Starfish

+0

Cảm ơn, tôi đã thử. Với '-4' tôi gặp lỗi tương tự. Với '-6' tôi nhận được: Tên hoặc dịch vụ không được biết TÍN DỤNG HTTP - Không thể mở ổ cắm TCP – fulv

+0

Bạn có thể đăng đầu ra của wget không? Tôi giả định vì bạn đang sử dụng theo đó URL mục tiêu thực hiện chuyển hướng. – Starfish

Trả lời

15

Thử sử dụng tùy chọn -N của check_http.

Tôi gặp sự cố tương tự và trong trường hợp của tôi, máy chủ web không chấm dứt kết nối sau khi gửi phản hồi (https đang hoạt động, http không phải). check_http cố gắng đọc từ socket mở cho đến khi máy chủ đóng kết nối. Nếu điều đó không xảy ra thì thời gian chờ xảy ra.

Tùy chọn -N yêu cầu check_http chỉ nhận tiêu đề chứ không phải nội dung của trang/tài liệu.

+1

Cảm ơn bạn, cuối cùng dịch vụ của tôi không còn ở trạng thái "PROBLEM" nữa! – fulv

+1

Chúc mừng cho giải pháp, tuy nhiên các kết nối không bị chấm dứt là dấu hiệu của một vấn đề có thể xảy ra trong ngăn xếp. OP có thể bình luận về sự thay đổi đã kích hoạt nó, nếu biết không? – cosimo

+0

Đã xảy ra sự cố tương tự và đó là do thiết bị mạng "tối ưu hóa". – Vegard

1

Tôi đã theo dõi sự cố của mình xuống một vấn đề với các nhà cung cấp bảo mật được định cấu hình trong phiên bản mới nhất của OpenSUSE.

Tóm tắt các trang web khác có vẻ như là một vấn đề với nỗ lực sử dụng giao thức TLSv2 có vẻ không hoạt động chính xác hoặc thiếu thứ gì đó trong cấu hình mặc định để cho phép nó hoạt động.

Để khắc phục sự cố, tôi đã nhận xét nhà cung cấp bảo mật được đề cập từ tệp cấu hình bảo mật JRE.

#security.provider.10=sun.security.pkcs11.SunPKCS11 

Security.provider. giá trị có thể khác trong cấu hình của bạn, nhưng về cơ bản, nhà cung cấp SunPKCS11 đang gặp vấn đề.

Cấu hình này thường được tìm thấy trong

$JAVA_HOME/lib/security/java.security 

của JRE mà bạn đang sử dụng.

0

cố định với url này trong nrpe.cfg: (trên Deb 6.0 Squeeze sử dụng Nagios-NRPE-server)

command[check_http]=/usr/lib/nagios/plugins/check_http -H localhost -p 8080 -N -u /login?from=%2F 
Các vấn đề liên quan