tôi cần phải loại bỏ tất cả các hàng trong đó các yếu tố từ cột 3 trở đi đều NaNLàm thế nào để loại bỏ các hàng với giá trị null từ cột thứ k trở đi trong python
df = DataFrame(np.random.randn(6, 5), index=['a', 'c', 'e', 'f', 'g','h'], columns=['one', 'two', 'three', 'four', 'five'])
df2 = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
df2.ix[1][0] = 111
df2.ix[1][1] = 222
Trong ví dụ trên, khung dữ liệu cuối cùng của tôi sẽ không có các hàng 'b' và 'c'.
Cách sử dụng df.dropna()
trong trường hợp này?
lẽ 'df2 .dropna (tập hợp con = df2.columns [k:], how = 'all') '? (chỉ để được tổng quát hơn) –
@Cảm ơn Paul. Đây là những gì tôi đang tìm kiếm – user1140126