Nếu tôi muốn để tính toán giá trị trung bình của hai nhóm trong Pandas, tôi có thể làm điều đó như thế này:T-test trong Pandas
data = {'Category': ['cat2','cat1','cat2','cat1','cat2','cat1','cat2','cat1','cat1','cat1','cat2'],
'values': [1,2,3,1,2,3,1,2,3,5,1]}
my_data = DataFrame(data)
my_data.groupby('Category').mean()
Category: values:
cat1 2.666667
cat2 1.600000
Tôi có rất nhiều dữ liệu được định dạng theo cách này, và bây giờ tôi cần phải thực hiện T -test để xem liệu giá trị trung bình của cat1 và cat2 có khác biệt về mặt thống kê hay không. Làm thế nào tôi có thể làm điều đó?