2015-07-31 15 views
6

Tôi có dữ liệu như dưới đây và tôi cần xác định phân phối dữ liệu. xin giúp đỡ.Cách xác định phân phối dữ liệu đã cho bằng cách sử dụng r

x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40) 
+2

Vui lòng xác định (với một số sự khắt khe về ngôn ngữ thống kê) ý của bạn là chính xác bằng cách "xác định phân phối dữ liệu". – Roland

+1

Bạn có ý nghĩa gì khi "xác định phân phối" ... Bạn có thể sử dụng 'hist (x)' để xem hình dạng của nó. Xét về "chứng minh khắt khe" (thực sự không bao giờ nghiêm ngặt ...), hãy thử nghiệm giả thuyết .. –

+1

Điều này có vẻ thống kê hơn là một câu hỏi lập trình. Xin vui lòng OP làm rõ những gì bạn đang cố gắng làm. – nicola

Trả lời

4

Thứ nhất, điều bạn có thể làm là để vẽ biểu đồ và che phủ các mật độ

hist(x, freq = FALSE) 
lines(density(x)) 

Sau đó, bạn sẽ thấy rằng việc phân phối là bi-modal và nó có thể là hỗn hợp của hai phân phối hoặc bất kỳ khác.

Khi bạn đã xác định phân phối ứng cử viên, 'qqplot' có thể giúp bạn so sánh trực quan các số liệu.

+0

Có cách nào khác để xác định phân phối tự động không? –

19

Một cách tiếp cận gọn gàng sẽ liên quan đến việc sử dụng gói fitdistrplus cung cấp các công cụ để phù hợp với phân phối. Ví dụ về dữ liệu của bạn.

library(fitdistrplus) 
descdist(x, discrete = FALSE) 

enter image description here

Bây giờ bạn có thể cố gắng để phù hợp với các bản phân phối khác nhau. Ví dụ:

normal_dist <- fitdist(x, "norm") 

abs sau đó kiểm tra việc phù hợp:

plot(normal_dist) 

Fitting


Là một điểm chung tôi sẽ đề nghị bạn nên có một cái nhìn tại this discussion tại Hội Chữ thập Validated, nơi chủ đề được thảo luận ở độ dài. Bạn cũng có thể sẵn sàng xem một bài báo bằng Delignette-Muller và Dutang - fitdistrplus: Gói R cho các bản phân phối phù hợp, có sẵn here nếu bạn quan tâm đến giải thích chi tiết hơn về cách sử dụng biểu đồ Cullen và Frey .

+3

Liên kết tới cuộc thảo luận về CV là một phần rất quan trọng của câu trả lời này. (+1) – Roland

+1

Cách diễn giải biểu đồ cullen và tự do này –

+2

@VanathaiyanS biểu đồ ** CF ** đang so sánh nghiêng và kurtosis của phân bố đã cho với phân phối đã chỉ định. Tôi sẽ đề nghị bạn hãy xem thảo luận được liên kết trong CV, tệp trợ giúp và giấy liên kết. Để tóm tắt/oversimplify trong một vài từ: * đối với một số phân phối, như bình thường, chỉ có một giá trị có thể cho skewness và kurtosis do đó có một điểm trên đồ thị. Đối với các bản phân phối khác, các khu vực của các giá trị có thể được biểu diễn. Đây là câu trả lời rất đơn giản, bạn cũng nên xem xét các phương pháp khác, nhưng biểu đồ ** CF ** là một khởi đầu tốt. – Konrad

Các vấn đề liên quan