Tôi có một số dữ liệu bóng đá hàng năm mà tôi muốn kiểm tra xem liệu các số liệu nhóm nhất định có thể lặp lại trong năm tới hay không. Dữ liệu của tôi là trong một data.frame và trông giống như sau:Sự tương quan của Dữ liệu về Dữ liệu trong R bằng cách sử dụng ggplot2
y2003 y2004 y2005
Team 1 51.95455 51.00000 53.59091
Team 2 54.18182 56.31818 49.09091
Team 3 48.68182 46.86364 49.22727
Team 4 50.86364 47.68182 48.72727
Những gì tôi muốn để có thể làm phân tán là điều này với "Năm n" trên trục x và "Năm n + 1" trên trục y. Vì vậy, ví dụ 2003 so với 2004, 2004 so với 2005, 2005 so với 2006, vv tất cả trên cùng một lô.
Sau đó tôi muốn có thể vẽ một đường phù hợp nhất để xem mức độ tương quan mạnh như thế nào, cho dù có lặp lại hay không.
Cách tốt nhất để thực hiện điều này trong R bằng ggplot2 là gì? Tôi có thể nhận được âm mưu ban đầu với:
p=ggplot(df,aes(y2003,y2004))
p + geom_point()
Sau đó, tôi chỉ cần thêm tất cả theo cách thủ công? Có một chức năng sẵn có cho loại điều này? Và nếu tôi thêm tất cả chúng một-by-một làm thế nào tôi sẽ có được sự phù hợp nhất?