2012-11-30 28 views
12

từ thư viện sciPy Tôi đã sử dụng: scipy.stats.stats nhập pearsonr để tính hệ số tương quan cho hai mảng và tôi nhận giá trị: (0.80751532276005755, 0.19248467723994242).Hệ số tương quan Pearson Giá trị p 2 đuôi có nghĩa là

Tôi nghĩ rằng tôi sẽ chỉ có một giá trị trong phạm vi từ -1 đến +1, vì vậy tôi không chắc chắn cách diễn giải hai kết quả này. Đây là hai mảng của tôi:

x = [50,500,1500,2500] 
y = [17, 6, 6, 194] 

và tôi đã làm:

pearsonr(x,y) 

Cảm ơn

+0

Bạn đã thử đọc tài liệu về chức năng đó chưa? – Femaref

+0

Có nhưng tôi không hoàn toàn chắc chắn về ý nghĩa của giá trị p 2 đuôi. Vì vậy, giá trị đầu tiên là mối tương quan và giá trị thứ hai xác suất của một tập hợp không được thực hiện tạo ra cùng một kết quả. – user94628

+1

Điều này, bây giờ, được chuyển đến diễn đàn thống kê. Đó là một câu hỏi thống kê cơ bản. – AGS

Trả lời

18

pearsonr() trả về một hai tuple bao gồm các hệ số tương quan và p-giá trị tương ứng:

  • Hệ số tương quan có thể dao động từ -1 đến +1.
  • Giả thuyết không có nghĩa là hai biến không tương quan. Giá trị p là một số giữa 0 và một đại diện cho xác suất mà dữ liệu của bạn sẽ phát sinh nếu giả thuyết không đúng là đúng.

Đối với một cuộc thảo luận thêm, xem http://www.eecs.qmul.ac.uk/~norman/blog_articles/p_values.pdf

Tôi nghĩ rằng tôi sẽ có chỉ có một giá trị trong phạm vi -1 đến +1

Nếu bạn chỉ cần tương quan hệ số, chỉ cần bỏ qua phần tử thứ hai của bộ dữ liệu (giá trị p):

corrxy = pearsonr(x,y)[0] 

Nó m ight đáng nói đến là cũng có numpy.corrcoef(), tính toán ma trận tương quan (không có giá trị p).

+0

Tôi cũng sẽ xem xét phương pháp gọn gàng. Cảm ơn lời giải thích. – user94628

Các vấn đề liên quan