Dưới đây là một số dữ liệu và một âm mưu:geom_smooth trên một tập hợp con của dữ liệu
set.seed(18)
data = data.frame(y=c(rep(0:1,3),rnorm(18,mean=0.5,sd=0.1)),colour=rep(1:2,12),x=rep(1:4,each=6))
ggplot(data,aes(x=x,y=y,colour=factor(colour)))+geom_point()+ geom_smooth(method='lm',formula=y~x,se=F)
Như bạn thấy hồi quy tuyến tính bị ảnh hưởng cao bởi các giá trị trong đó x = 1. Tôi có thể lấy các phép hồi quy tuyến tính được tính cho x> = 2 nhưng hiển thị các giá trị cho x = 1 (y bằng 0 hoặc 1). Biểu đồ kết quả sẽ giống hệt nhau ngoại trừ các phép hồi quy tuyến tính. Họ sẽ không "chịu" từ ảnh hưởng của các giá trị trên abscisse = 1
Aahh Tôi thích các giải pháp đơn giản! Cảm ơn rất nhiều. Và cảm ơn cũng cho lời khuyên và minh bạch lừa. –
Tôi nên làm gì nếu giải pháp này tạo ra lỗi này "Tính thẩm mỹ phải là độ dài 1 hoặc giống như dữ liệu" trên tập dữ liệu của tôi? –