Tôi cần tóm tắt một khung dữ liệu bằng một số biến, bỏ qua các biến khác. Điều này đôi khi được gọi là sụp đổ. Ví dụ. nếu tôi có một dataframe như thế này:Làm thế nào tôi có thể thu gọn một khung dữ liệu theo một số biến, lấy giá trị trung bình trên một số biến khác,
Widget Type Energy
egg 1 20
egg 2 30
jap 3 50
jap 1 60
Sau đó bị sụp đổ bởi Widget, với năng lượng biến phụ thuộc, Năng lượng ~ Widget, sẽ mang lại
Widget Energy
egg 25
jap 55
Trong Excel chức năng gần nhất có thể là "bảng Pivot" và tôi đã làm việc ra làm thế nào để làm điều đó trong python (http://alexholcombe.wordpress.com/2009/01/26/summarizing-data-by-combinations-of-variables-with-python/), và đây là một ví dụ với R bằng cách sử dụng thư viện doBy để làm một cái gì đó rất liên quan (http://www.mail-archive.com/[email protected]/msg02643.html), nhưng có một cách dễ dàng để làm ở trên? Và thậm chí tốt hơn là có bất cứ điều gì được xây dựng vào thư viện ggplot2 để tạo ra các ô mà sụp đổ trên một số biến?
'by' cũng có ích trong từng thời kỳ. –
đúng. cũng 'ave' –
cho một ví dụ sử dụng' ddply' từ gói 'plyr' hãy xem câu hỏi liên quan này: http://stackoverflow.com/questions/2473659/r-what-are-the-best-functions- đến-deal-với-concatenating-và-trung bình-giá trị-in – mropa