Tôi đang cố gắng chạy một số phân tích thống kê về thử nghiệm thực địa được xây dựng trên 2 trang web trong cùng một mùa phát triển.ANOVA với thiết kế khối và các biện pháp lặp lại
Tại cả hai địa điểm (Site
, cấp: HF | NW) thiết kế thử nghiệm là một RCBD với 4 (n = 4) khối (Block
, mức: 1 | 2 | 3 | 4 trong mỗi Site
). Có 4 phương pháp điều trị - 3 dạng phân bón nitơ khác nhau và kiểm soát (không phân đạm) (Treatment
, mức độ: AN, U, IU, C). Trong thời gian thử nghiệm thực địa, có 3 giai đoạn riêng biệt bắt đầu bằng việc bổ sung phân bón và kết thúc bằng việc thu hoạch cỏ. Những giai đoạn này đã được đưa ra mức 1 | 2 | 3 theo hệ số N_app
.
Có một loạt các phép đo mà tôi muốn thử nghiệm các giả thuyết H0 sau trên:
Treatment
(H0) không có hiệu lực về đo lường
Hai trong số các phép đo tôi đặc biệt quan tâm là : năng suất cỏ và khí thải amoniac.
Bắt đầu với năng suất cỏ (Dry_tonnes_ha
) như hiện here, a nice balanced data set
Các dữ liệu có thể được tải về trong R sử dụng đoạn mã sau:
library(tidyverse)
download.file('https://www.dropbox.com/s/w5ramntwdgpn0e3/HF_NW_grass_yield_data.csv?raw=1', destfile = "HF_NW_grass_yield_data.csv", method = "auto")
raw_data <- read.csv("HF_NW_grass_yield_data.csv", stringsAsFactors = FALSE)
HF_NW_grass <- raw_data %>% mutate_at(vars(Site, N_app, Block, Plot, Treatment), as.factor) %>%
mutate(Date = as.Date(Date, format = "%d/%m/%Y"),
Treatment = factor(Treatment, levels = c("AN", "U", "IU", "C")))
Tôi đã có một đi vào chạy một ANOVA về việc sử dụng này cách tiếp cận sau:
model_1 <- aov(formula = Dry_tonnes_ha ~ Treatment * N_app + Site/Block, data = HF_NW_grass, projections = TRUE)
Tôi có một vài lo ngại về điều này.
Thứ nhất, cách tốt nhất để kiểm tra các giả định là gì? Đối với ANOVA một chiều đơn giản, tôi sẽ sử dụng shapiro.test()
và bartlett.test()
trên biến phụ thuộc (Dry_tonnes_ha
) để đánh giá tính bình thường và tính không đồng nhất của phương sai. Tôi có thể sử dụng cùng một cách tiếp cận ở đây không?
Thứ hai, tôi lo ngại rằng N_app
là phép đo lặp lại vì cùng một phép đo được lấy từ cùng một lô trên 3 giai đoạn khác nhau - cách tốt nhất để xây dựng các biện pháp lặp lại này vào mô hình là gì?
Thứ ba, tôi không chắc chắn cách tốt nhất để làm tổ Block
trong phạm vi Site
. Tại cả hai trang web, các cấp độ của Block
là 1: 4. Tôi có cần phải có các cấp độ Block
duy nhất cho mỗi trang web không?
Tôi có another data set for NH3 emissions here. Mã R để tải xuống:
download.file('https://www.dropbox.com/s/0ax16x95m2z3fb5/HF_NW_NH3_emissions.csv?raw=1', destfile = "HF_NW_NH3_emissions.csv", method = "auto")
raw_data_1 <- read.csv("HF_NW_NH3_emissions.csv", stringsAsFactors = FALSE)
HF_NW_NH3 <- raw_data_1 %>% mutate_at(vars(Site, N_app, Block, Plot, Treatment), as.factor) %>%
mutate(Treatment = factor(Treatment, levels = c("AN", "U", "IU", "C")))
Vì điều này, tôi có tất cả những lo ngại ở trên với việc bổ sung tập dữ liệu không cân bằng. Tại HF
cho N_app
1 n = 3, nhưng đối với 3 n = 4 Tại NW
n = 4 cho tất cả các mức N_app
. Tại NF
phép đo được chỉ thực hiện trên Treatment
mức U
và IU
Tại NW
measuremnts được thực hiện trên Treatment
mức AN
, U
và IU
Tôi không chắc chắn làm thế nào để đối phó với mức độ này thêm phức tạp. Tôi bị cám dỗ chỉ phân tích là 2 trang web riêng biệt (thực tế là thời gian N_app
không giống nhau ở mỗi trang web có thể khuyến khích phương pháp này). Tôi có thể sử dụng loại iii tổng của hình vuông ANOVA ở đây không?
Điều đó đã được đề xuất với tôi rằng phương pháp tạo mô hình hỗn hợp tuyến tính có thể là con đường phía trước nhưng tôi không quen sử dụng chúng.
Tôi sẽ hoan nghênh suy nghĩ của bạn về bất kỳ điều nào ở trên. Cảm ơn vì đã dành thời gian cho tôi.
Rory
Cảm ơn câu trả lời của bạn. Các số liệu thống kê càng phức tạp càng trở nên chủ quan hơn trong quá trình này! Thông tin tuyệt vời về các giả định. Tôi đang đặt câu hỏi nếu tôi cần một biện pháp lặp đi lặp lại. Tất cả các phép đo mà tôi đang phân tích chỉ xảy ra một lần cho mỗi 'N_app', cùng một' ô' được sử dụng cho 3 giai đoạn 'N_app' dẫn tôi đến một biện pháp lặp lại là cần thiết. Sẽ có một cái nhìn khác về các mô hình hỗn hợp tuyến tính. Tôi cũng có thể đơn giản hóa và phân tích hai trang web một cách riêng biệt. –
Tôi đoán các mô hình hỗn hợp tuyến tính cũng có thể trợ giúp với tập dữ liệu không cân bằng. Mặc dù tôi đoán tôi có thể sử dụng 'Anova' ở đây với loại iii ss? –