Tôi cần phân tích một số dữ liệu về các phiên internet cho một Đường DSL. Tôi muốn xem xét cách phân bổ thời lượng phiên. Tôi đã tìm ra một cách đơn giản để làm điều này sẽ là bắt đầu bằng cách tạo một biểu đồ mật độ xác suất trong suốt thời gian của tất cả các phiên.Mật độ xác suất của dữ liệu
Tôi đã tải dữ liệu trong R và sử dụng chức năng density()
. Vì vậy, nó giống như thế này
plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
xlab = "duration(h)", ylab = "probability density")
Tôi mới dùng R và loại phân tích này. Đây là những gì tôi tìm thấy từ đi qua google. Tôi có một âm mưu nhưng tôi bị bỏ lại với một số câu hỏi. Đây có phải là chức năng đúng để làm những gì tôi đang cố gắng làm hay có cái gì khác?
Trong cốt truyện tôi thấy rằng thang đo trục Y là từ 0 ... 1.5. Tôi không hiểu làm thế nào nó có thể là 1,5, không nên nó từ 0 ... 1?
Ngoài ra, tôi muốn có đường cong mượt mà hơn. Kể từ đó, tập dữ liệu thực sự lớn các dòng thực sự bị lởm chởm. Sẽ tốt hơn nếu chúng được làm mịn khi tôi trình bày điều này. Tôi sẽ làm thế nào?
Bạn hiểu sai mật độ. Mật độ của X có thể được xem như là một giá trị ** tỷ lệ thuận với ** cơ hội vẽ từ dân số một số nằm trong khoảng gần của X. Bây giờ theo định nghĩa tích phân của hàm mật độ bằng 1.Điều này không có nghĩa là giá trị tối đa của hàm mật độ phải là 1, nó có thể dễ dàng lớn hơn. Trong thực tế, đối với phân bố F với df = (1,1), giá trị lớn nhất của mật độ (tại 0) thậm chí là vô cùng. –
@ Joris yes Tôi bây giờ nhận ra rằng tôi đã không giải thích nó một cách chính xác. khá đơn giản, tôi giả định rằng vì phân bố xác suất của nó sẽ nhỏ hơn 1 :). – sfactor