Tôi gặp vấn đề khi thực hiện kiểm tra t trong scipy, điều đó khiến tôi từ từ phát điên. Nó phải đơn giản để giải quyết, nhưng không có gì tôi làm việc và không có giải pháp tôi có thể tìm thấy thông qua tìm kiếm rộng rãi. Tôi đang sử dụng Spyder trên bản phân phối mới nhất của Anaconda.T-Test trong Scipy với các giá trị NaN
Cụ thể: Tôi muốn so sánh các phương tiện giữa hai cột –– 'Trait_A' và 'Trait_B' –– trong khung dữ liệu gấu trúc mà tôi đã nhập từ tệp csv. Một số giá trị trong một trong các cột là 'Nan' ('Not a Number'). Cài đặt mặc định trên các chức năng t-test scipy độc lập không chứa các giá trị 'NaN'. Tuy nhiên, setting the 'nan_policy' parameter to 'omit' should deal with this. Tuy nhiên, khi tôi thực hiện, số liệu thống kê kiểm tra và giá trị p trở lại là 'NaN'. Khi tôi hạn chế phạm vi của các giá trị được đề cập đến các con số thực tế, kiểm tra hoạt động tốt. Dữ liệu và mã của tôi dưới đây; bất cứ ai có thể đề nghị những gì tôi đang làm sai? Cảm ơn!
dữ liệu:
Trait_A Trait_B
0 1.714286 0.000000
1 4.275862 4.000000
2 0.500000 4.625000
3 1.000000 0.000000
4 1.000000 4.000000
5 1.142857 1.000000
6 2.000000 1.000000
7 9.416667 1.956522
8 2.052632 0.571429
9 2.100000 0.166667
10 0.666667 0.000000
11 2.333333 1.705882
12 2.768145 NaN
13 0.000000 NaN
14 6.333333 NaN
15 0.928571 NaN
Mã của tôi:
import pandas as pd
import scipy.stats as sp
data= pd.read_csv("filepath/Data2.csv")
print (sp.stats.ttest_ind(data['Trait_A'], data['Trait_B'], nan_policy='omit'))
kết quả của tôi:
Ttest_indResult(statistic=nan, pvalue=nan)
Cảm ơn rất nhiều! Điều này hoạt động chính xác như tôi hy vọng; có vẻ như đó là một lỗi chắc chắn. Tôi sẽ báo cáo cho các nhà phát triển Scipy. – Lodore66
Bạn đang sử dụng phiên bản scipy nào? (nan_policy là mới trong phiên bản 0,17.) nếu là 0,17 trở lên, vui lòng gửi lỗi –
Tôi đang sử dụng phiên bản 0,17 –– vâng, lỗi sẽ được gửi. – Lodore66