2009-03-16 13 views
5

Tôi đang sử dụng OSX và hệ thống của tôi không phản hồi trong vài giây khoảng 10 phút một lần. (Nó mang lại cho tôi quả bóng quay vòng của cái chết). Tôi đã tự hỏi nếu có bất kỳ cách nào tôi có thể cô lập vấn đề (tôi có rất nhiều RAM, và không có pageouts/thrashing). Bất kỳ công cụ Unix/OSX nào có thể giúp tôi theo dõi và cô lập nguyên nhân của hành vi này?Cách tách các nguyên nhân của hệ thống treo trên Unix/OSX

+0

tôi đã nghi ngờ điều gì đó dọc theo các dòng đó: P – mt3

Trả lời

2

Tôi muốn chạy hỗn hợp 'trên cùng' cũng như đuôi -f/var/log/tin nhắn (hoặc bất cứ nơi nào tệp nhật ký chính của bạn).

Có thể xảy ra ngay trước/sau khi treo, một số thông báo lỗi sẽ xuất hiện. Từ đó bạn có thể bắt đầu loại bỏ các vấn đề của bạn.

1

Là dòng đầu tiên của cuộc tấn công, tôi khuyên bạn nên giữ top chạy trong cửa sổ Thiết bị đầu cuối nơi bạn có thể xem và xem các công việc chạy trốn ở đó.

+0

có, đầu mở (như là hoạt động giám sát), nhưng không có bất kỳ tải CPU nặng nào được hiển thị. – mt3

1

Nếu các câu trả lời khác không nhận được bạn ở bất cứ nơi nào, tôi sẽ chạy xem thời gian hoạt động và ghi chú về thời gian và thời gian tăng khi nó bị khóa. Khóa khoảng cứ sau 10 phút là rất khác với việc khóa chính xác cứ 10 phút một lần; sau này gợi ý tìm kiếm trong crontab -l cho công việc bắt đầu bằng */10.

+0

Có, không chính xác là 10 phút, chỉ khoảng 10 phút. Thnx cho các đề xuất dù sao. – mt3

2

Trình giám sát hoạt động là phiên bản GUI ở trên cùng và với Leopard, bạn có thể sử dụng chức năng 'Quy trình mẫu' để xem nhiệm vụ thủ phạm của bạn đang dành phần lớn thời gian của họ. Cũng trong Utilities bạn sẽ tìm thấy Console aka tail -f/var/log/messages.

+0

Tôi nghĩ bạn có nghĩa là Hoạt động giám sát? – mt3

4

Màn hình hoạt động (cmd+space, loại, activity monitor), nên cung cấp cho bạn tổng quan trực quan về những gì đang xảy ra trên hệ thống của bạn. Nếu như bạn nói nó là không có quá trình làm tắc nghẽn CPU, xin vui lòng hãy xem các hoạt động đĩa/IO. Có lẽ đĩa của bạn đang đi về phía nam.

1

Không phản hồi định kỳ thường là trường hợp khi hoán đổi đang diễn ra. Bạn có đủ bộ nhớ trong hệ thống của mình không? Kiểm tra đĩa io để xem có các đỉnh hay không.

EDIT:

Tôi đã thấy hành vi tương tự trên máy Mac của tôi thời gian gần đây mà là do hệ thống tập tin bị phá vỡ để OS X cố gắng truy cập không tồn tại khối trên đĩa và thậm chí cố gắng sửa chữa nó bằng Disk Manger nói tôi định dạng lại và cài đặt lại. Làm điều đó và tái lập với Time Machine đã giúp!

Nếu bạn thực hiện việc này, hãy kiểm tra lại xem Journalling có được bật trên HFS trên đĩa cứng hay không. Điều này giúp khá một chút tránh nó xảy ra lần nữa.

1

Sử dụng thiết bị của Apple. Thành thật mà nói, nó đã giúp rất nhiều trong việc tìm kiếm hang như thế này.

+1

bất kỳ lời khuyên nào khác về việc sử dụng các công cụ cho mục đích này? tôi tưởng tượng đây là cách tiếp cận mạnh nhất. – mt3

3

Tôi đã gặp sự cố liên tục trong những năm bị treo hệ thống. Có vẻ như nói chung họ là một kết quả của lỗi hệ thống tập tin, tuy nhiên Apple không làm đủ để chăm sóc vấn đề này. Độ tin cậy của hệ thống phải là trọng tâm 100% và tôi chắc chắn bị bệnh về những vấn đề này. Tôi đã bắt đầu di chuyển rất nhiều tập tin và tất cả các bản sao lưu sang một khối lượng ZFS trên một máy chủ FreeBSD và điều này giúp một chút vì nó đã bắt đầu dễ dàng cho tâm trí của tôi và cho phép tôi phục hồi nhanh hơn từ các vấn đề. Ngoài ra tôi đã đặt khối lượng hệ thống của tôi trên một ổ SSD lớn (240GB vì tôi có rất nhiều tập tin hỗ trợ và đang cố giữ cho mọi thứ không bị chia quá nhiều với các liên kết tượng trưng) và thư mục Users trên ổ đĩa khác. Điều này cũng đã giúp tăng thêm độ tin cậy.

Có nói điều này, bạn nên cố gắng khám phá spindumpstackshot để xem liệu bạn có thể bắt các quy trình được cố định trước khi hệ thống đóng băng hoàn toàn không. Rất có thể bạn có một hoặc hai ứng dụng đang cố gắng truy cập vào các khối không hợp lệ và nó chỉ treo hệ thống hoặc bạn có một quá trình chặn tất cả những người khác vì một lý do nào đó với một cuộc gọi hệ thống ngừng hoạt động.

Apple đã sử dụng stackshot một vài lần với tôi trong vài năm trở lại đây để săn một số buggers khó chịu xuống và liên kết sau đây có thể làm sáng tỏ về săn làm thế nào để có lẽ tốt hơn yêu tinh này xuống: http://www.stormacq.com/?p=346

Cũng thử: top -l2 -S > top_output.txt và khắc phục kết quả cho quá trình treo/zombie.

Bạn càng tìm hiểu sâu hơn về điều này, bạn có thể thấy hữu ích khi đăng ký danh sách nhà phát triển hạt nhân ([email protected]) vì có một số cookie rất sắc nét ở đây có thể làm sáng tỏ một số vấn đề mơ hồ nhất và giúp hiểu chính xác những gì mà người hoảng sợ đang nói.

Ngoài ra, bạn có thể muốn gỡ cài đặt mọi máy ảo mà bạn đã cài đặt. Có một nhà phát triển cụ thể, tôi đã nghe từ các nguồn rất đáng tin cậy, có vấn đề hypervisor rất bị lỗi và nó sẽ là khôn ngoan để nhìn vào đó nếu bạn có bất kỳ cài đặt. Nó có thể là thời gian để làm sạch kexts của bạn hoàn toàn là tốt.

Nhưng, tất cả-trong-tất cả, chúng tôi thực sự khá tuyệt vọng cần một hệ thống tập tin tốt hơn và chủ động cơ chế trong đó để xem cho các khối xấu. Tôi ca ngợi ngày và hét lên vì vui mừng khi tôi nghĩ rằng chúng tôi đã nhận được ZFS chính thức. Tôi nghi ngờ Lion là tốt hơn nhiều trên HFS + trước đáng buồn và tôi chắc chắn đang xem xét ZFS cho người dùng của tôi khối lượng + lưu trữ khác trên máy trạm do nó có khả năng chà cho các khối xấu và để loại bỏ các vấn đề như thế này.

Chúng là nguyên nhân của sự tồn tại của chúng tôi trên phần cứng của Apple và đã làm việc trong lĩnh vực này trong 20 năm và hàng nghìn khách hàng, lỗi ổ đĩa cứng nên được xem là không thể tha thứ tại thời điểm này. Ngay cả khi các mfgs thực sự không thể và sẽ không sửa chữa nó, onus rơi vào các nhà phát triển hệ điều hành để xử lý các ngoại lệ tốt hơn và bảo vệ chống lại những thất bại đó để giữ mất dữ liệu im lặng và những cơn ác mộng như thế này.

Các vấn đề liên quan