2015-06-28 19 views
5

Tôi đang cố tính toán độ lệch trung bình trung bình của một mẫu ("S") của các số. Kết quả tôi nhận được khi sử dụng chức năng "mad()" và khi thực hiện các phép tính độ lệch trung bình trung bình, mỗi bước một bước khác nhau. Tại sao?Tại sao kết quả của mad (x) khác với kết quả mong đợi?

s<- c(100,110,114,121,130,130,160) 

Sử dụng "điên()" chức năng, tôi nhận được:

> mad(s) 
[1] 13.3434 

Khi phá vỡ công thức và làm các hoạt động tương tự một bước tại một thời điểm, tôi nhận được:

> sum(abs(s-mean(s)))/length(s) 
[1] 14.08163 

Tại sao các kết quả này lại khác nhau?

Tôi có gặp lỗi khi nhập công thức của mình không? (Điều này sẽ không đáng ngạc nhiên - tôi chỉ mới bắt đầu học R). Có gì sai với công thức của tôi?

Hoặc là công thức mà R sử dụng để tính toán độ lệch trung bình trung bình khác nhau từ sau (đưa ra trên Wikipedia)

MAD = (tổng của (giá trị tuyệt đối của (mỗi giá trị trừ đi giá trị trung bình của mẫu))) chia cho (số lượng giá trị trong mẫu)?

(Cảm ơn sự giúp đỡ của bạn!)

Trả lời

8

"MAD" không may là thuật ngữ có nhiều ý nghĩa; độ lệch tuyệt đối trung bình từ trung bình (đôi khi chỉ được gọi là MD hoặc độ lệch trung bình), độ lệch tuyệt đối trung bình từ trung bình, độ lệch tuyệt đối trung bình từ trung bình (phát sinh khi thang máy tính trong Laplace), vv. - không phải là trọng tài sử dụng; nó đôi khi có thể là một chút phong cách riêng trong việc sử dụng các thuật ngữ (đó không phải là một lời chỉ trích đặc biệt của Wikipedia; nó vốn có một phần vốn có trong bản chất của sự vật). [Cá nhân trong trường hợp không có manh mối hơn tôi thường giải thích MAD như độ lệch tuyệt đối trung bình từ trung bình, và mong đợi độ lệch tuyệt đối trung bình từ trung bình nếu không được viết đầy đủ để được viết là "độ lệch trung bình"/"MD" hoặc " có nghĩa là độ lệch tuyệt đối"]

câu hỏi trong đó R là điện toán được giải quyết bằng thủ đoạn đơn giản của ?mad:.

mad {stats} R Documentation 

Median Absolute Deviation 

Description 

Compute the median absolute deviation, i.e., the (lo-/hi-) median of the 
absolute deviations from the median, and (by default) adjust by a factor 
for asymptotically normal consistency. 

Cũng giống như một gợi ý chung, khi sử dụng chức năng lần đầu tiên, don' giả sử bạn biết nó đang làm gì. Ví dụ: trước khi tôi đọc trợ giúp cho MAD lần đầu tiên, tôi sẽ không dự kiến ​​sẽ nhân với hằng số đó làm mặc định. (Tôi nghĩ đó là một ý tưởng tồi, vì điều đó có nghĩa là mặc định nó không thực sự tính bất cứ thứ gì gọi là MAD, nhưng thay vào đó là ước lượng of cho dân số nơi phần không bị nhiễm là Gaussian - nhưng đó là cách nó hoạt động.)

Hầu hết các chức năng sẽ làm những gì bạn nghĩ rằng chúng làm, nhưng một số có thể làm bạn ngạc nhiên. Kiểm tra các định nghĩa trong trợ giúp, xem cách các yếu tố đầu vào và đầu ra được xác định và thử các ví dụ.

Ngẫu nhiên nếu bạn muốn độ lệch trung bình (tuyệt đối) từ mức trung bình, bạn có thể nhận được điều đó bằng mad(x,mean(x),1). Nhưng nếu bạn muốn có nghĩa là độ lệch trung bình so với giá trị trung bình, tôi không biết liệu có gì đơn giản hơn để viết hơn mean(abs(x-mean(x))) hay không; nó có ít nhất lợi thế của việc hoàn toàn rõ ràng.

+0

Cảm ơn bạn đã trả lời của bạn! Tôi đã cố gắng để đạt được độ lệch trung bình từ trung bình (cho một mẫu/vector (X <-), và không nhận ra rằng điên (X) –

1

Như @Glen_b đề xuất, mad thực hiện nhiều hơn việc áp dụng công thức, bao gồm "chỉnh sửa" cho tính nhất quán với tính bình thường.

Nhìn một ví dụ:

#with mad 
mad(s) 
mad(s,center= mean(s)) 

# using formulas 
sum(abs(s-median(s)))/length(s) 
sum(abs(s-mean(s)))/length(s) 

> mad(s) 
[1] 13.3434 
> mad(s,center= mean(s)) 
[1] 14.1906 
> 
> sum(abs(s-median(s)))/length(s) 
[1] 13.71429 
> sum(abs(s-mean(s)))/length(s) 
[1] 14.08163 
+0

Cảm ơn bạn! Tôi đã không nhận ra rằng điên() Bạn và glen_b đã hoàn toàn trả lời câu hỏi của tôi –

0

Là một thêm, nếu bạn đang cố gắng để tính toán độ lệch tuyệt đối trung bình từ mức trung bình, loại

mad(s,constant=1) 
+0

Tôi rất tiếc khi viết câu trả lời của bạn nhưng câu trả lời của bạn dường như giống với nhận xét hơn là câu trả lời hoàn chỉnh. –

Các vấn đề liên quan