Tôi có một gấu trúc DataFrame
với định dạng nàyExcel như công thức với gấu trúc
User_id|2014-01|2014-02|2014-03|2014-04|2014-05|...|2014-12
1 | 7 | NaN | NaN | NaN | NaN |...| NaN
2 | NaN | 5 | NaN | NaN | 9 |...| NaN
3 | 2 | 4 | NaN | NaN | NaN |...| NaN
Nói cách, các cột là tháng, chỉ số là user_id
và mỗi tế bào chứa một số nguyên, hoặc NaN
Các con số đại diện cho các hành động đã được thực hiện và một hành động được coi là thành công nếu 3
tháng sau đó, không cần thực hiện hành động nào khác.
Mục tiêu của tôi là để tìm danh sách các hành động thành công
Trong Excel, tôi muốn viết một công thức như thế này:
Sheet2!E5=AND(Sheet1!E5<>"NaN",Sheet1!D5="NaN",Sheet1!C5="NaN",Sheet1!B5="NaN")
Và sẽ kéo nó vào phần còn lại của các cột, và sau đó tôi sẽ có chỉ báo liệu một hành động có thành công hay không.
Làm thế nào điều này có thể được thực hiện hiệu quả với gấu trúc?
Mẫu đầu ra:
Đối với ví dụ đưa ra ở trên, sản lượng mong muốn nên là:
User_id|2014-01|2014-02|2014-03|2014-04|2014-05|
1 | T | F | F | F | F |
2 | F | F | F | F | ? |
3 | F | T | F | F | F |
Vì vậy, sau đó bạn là gì? Cho dù trong một tháng cụ thể, nó là 'NaN' và 3 tháng trước đó cũng là' NaN'? – EdChum
Bạn cần hiển thị thêm dữ liệu mẫu và cũng có thể thêm kết quả mong muốn. Dựa trên mô tả của bạn, công thức excel đó sẽ không đủ bởi vì tháng hành động có thể thay đổi từ hàng này sang hàng khác. Chỉ cần sao chép công thức excel đó là rất dễ dàng trong gấu trúc với 'any()' hoặc 'all()'. – JohnE
Tôi quan tâm đến một chỉ số cho 'int' giá trị với 3 hậu quả' NaN 's sau khi họ, tôi đã thêm một ví dụ. –