Tôi có chuỗi thời gian bán hàng theo ID tài khoản. Để tính toán mức tăng trưởng trung bình, tôi cần trích xuất tháng đầu tiên với doanh số khác 0 cho mỗi ID. Vì tài khoản có thể đã được thiết lập vào các thời điểm khác nhau, tôi cần phải xác định động khi bán hàng> 0 lần đầu tiên trong tài khoản.Tìm lần xuất hiện đầu tiên khác 0 trong khung dữ liệu
Chỉ mục cho hàng sẽ đủ để tôi chuyển đến một hàm tính toán tăng trưởng. Vì vậy, tôi mong đợi các kết quả sau đây bằng ID tài khoản:
54 - [1]
87 - [4]
95 - [2]
I tried `apply(df$Sales,2,match,x>0)` but this doesn't work.
Mọi con trỏ? Ngoài ra, có cách nào dễ dàng hơn để tính CAGR với tập dữ liệu này không?
Cảm ơn trước!
CalendarMonth ID Sales
8/1/2008 54 6692.60274
9/1/2008 54 6476.712329
10/1/2008 54 6692.60274
11/1/2008 54 6476.712329
12/1/2008 54 11098.60822
7/1/2008 87 0
8/1/2008 87 0
9/1/2008 87 0
10/1/2008 87 18617.94155
11/1/2008 87 18017.36279
12/1/2008 87 18617.94155
1/1/2009 87 18617.94155
2/1/2009 87 16816.20527
7/1/2008 95 0
8/1/2008 95 8015.956284
9/1/2008 95 0
10/1/2008 95 8015.956284
11/1/2008 95 6309.447514
12/1/2008 95 6519.762431
1/1/2009 95 6519.762431
Bạn có nói rằng bạn muốn chỉ mục cho hàng đó trong số một tập con của các mục nhập cho một ID mà doanh số bán hàng khác không? Bởi vì 4 cho 87 là chỉ khi bạn đặt bảng này, nếu không nó sẽ là 9 (đếm từ đầu). –
Vâng, đó là chính xác. Tôi chưa hoàn toàn tìm ra cách nhưng với plyr và ggplot, tôi có tầm nhìn về làm việc trên các tập con ID, để tính toán hiệu quả và hiển thị số liệu thống kê tăng trưởng trung bình. – user1100825