Đây có thể là một câu hỏi ngớ ngẩn, nhưng tôi đã đọc qua chương của Crawley về các khung dữ liệu và quét internet và vẫn chưa thể thực hiện bất kỳ điều gì.Tổng hợp các hàng dựa trên các kết hợp yếu tố cụ thể
Đây là một tập dữ liệu mẫu tương tự như tôi:
> data<-data.frame(site=c("A","A","A","A","B","B"), plant=c("buttercup","buttercup",
"buttercup","rose","buttercup","rose"), treatment=c(1,1,2,1,1,1),
plant_numb=c(1,1,2,1,1,2), fruits=c(1,2,1,4,3,2),seeds=c(45,67,32,43,13,25))
> data
site plant treatment plant_numb fruits seeds
1 A buttercup 1 1 1 45
2 A buttercup 1 1 2 67
3 A buttercup 2 2 1 32
4 A rose 1 1 4 43
5 B buttercup 1 1 3 13
6 B rose 1 2 2 25
Những gì tôi muốn làm là tạo ra một kịch bản mà "hạt giống" và "trái cây" được tóm tắt bất cứ khi nào độc đáo trang web & cây & điều trị & plant_numb kết hợp hiện hữu. Lý tưởng nhất, điều này sẽ dẫn đến việc giảm lượng hàng, nhưng một bảo quản các cột gốc (tức là tôi cần những ví dụ trên để trông như thế này :)
site plant treatment plant_numb fruits seeds
1 A buttercup 1 1 3 112
2 A buttercup 2 2 1 32
3 A rose 1 1 4 43
4 B buttercup 1 1 3 13
5 B rose 1 2 2 25
Ví dụ này là khá cơ bản (bộ dữ liệu của tôi là ~ 5000 hàng), và mặc dù ở đây bạn chỉ thấy hai hàng được yêu cầu để được tổng hợp, số hàng cần phải được tổng hợp khác nhau, và nằm trong khoảng từ 1 đến ~ 45.
Tôi đã thử rowsum() và tapply() với kết quả khá ảm đạm (các lỗi cho tôi biết rằng các hàm này không có ý nghĩa cho các yếu tố), vì vậy nếu bạn thậm chí có thể chỉ cho tôi đúng hướng, tôi rất nhiều sẽ đánh giá cao nó!
Cảm ơn bạn rất nhiều!
nhìn vào Thẻ 'plyr' và' data.table'. Rất nhiều câu hỏi về cơ bản giải quyết vấn đề này. Chúc may mắn! – Chase
Xem thêm http://4dpiecharts.com/2011/12/16/a-quick-primer-on-split-apply-combine-problems/ –