Khi đi vào NumPy từ Matlab, có thể bạn sẽ muốn giữ lại các tài liệu cho cả hai tiện dụng. Chúng tương tự nhau nhưng thường khác nhau về chi tiết nhỏ nhưng quan trọng. Về cơ bản, chúng tính toán độ lệch chuẩn khác nhau. Tôi thực sự khuyên bạn nên kiểm tra tài liệu cho bất kỳ thứ gì bạn sử dụng để tính toán độ lệch chuẩn, cho dù máy tính bỏ túi hay ngôn ngữ lập trình, vì mặc định không được chuẩn hóa (xin lỗi!).
NumPy STD: http://docs.scipy.org/doc/numpy/reference/generated/numpy.std.html
Matlab STD: http://www.mathworks.com/help/matlab/ref/std.html
Các tài liệu NumPy cho std
là một chút mờ đục, IMHO, đặc biệt là xem xét rằng NumPy tài liệu nói chung là khá rõ ràng. Nếu bạn đọc đủ xa: The average squared deviation is normally calculated as x.sum()/N, where N = len(x). If, however, ddof is specified, the divisor N - ddof is used instead. In standard statistical practice, ddof=1 provides an unbiased estimator of the variance of the infinite population.
(Trong tiếng Anh, mặc định là pop std dev, đặt ddof=1
cho mẫu std dev).
OTOH, các tài liệu Matlab làm sáng tỏ sự khác biệt đó là vấp ngã bạn lên:
There are two common textbook definitions for the standard deviation s of a data vector X. [equations omitted] n is the number of elements in the sample. The two forms of the equation differ only in n – 1 versus n in the divisor.
Vì vậy, theo mặc định, Matlab tính toán độ lệch chuẩn mẫu (N-1 trong số chia, vì vậy lớn hơn để bù đắp cho thực tế đây là một mẫu) và Numpy tính toán độ lệch chuẩn dân số (N trong ước số). Bạn sử dụng tham số ddof
để chuyển sang tiêu chuẩn mẫu hoặc bất kỳ mẫu số nào khác mà bạn muốn (vượt quá kiến thức thống kê của tôi).
Cuối cùng, nó không giúp đỡ về vấn đề này, nhưng có thể bạn sẽ thấy điều này hữu ích tại một số điểm.http://wiki.scipy.org/NumPy_for_Matlab_Users
Chia bởi N-1 cung cấp cho phương sai mẫu, nhưng NumPy tính phương sai dân. –
Giving này một phiếu bầu tán thành vì sự khác biệt giữa dân số và độ lệch chuẩn mẫu ít khi chú ý tới cho đến khi kết quả thất bại để phù hợp - chọn một, và biết lý do tại sao bạn đang sử dụng nó, cả hai sẽ giúp ngăn ngừa vấn đề này và cũng có thể buộc bạn phải hữu ích nghĩ về vấn đề của bạn nhiều hơn một chút. (Tất cả đều nói từ kinh nghiệm khó chịu). – schodge