2008-08-04 59 views
12

Tôi đang viết một ứng dụng để giúp tạo điều kiện cho một số nghiên cứu, và một phần của việc này liên quan đến việc thực hiện một số tính toán thống kê. Hiện tại, các nhà nghiên cứu đang sử dụng một chương trình có tên là SPSS. Một phần của sản lượng mà họ quan tâm đến ngoại hình như thế này:Làm cách nào để tính toán các thống kê này?

[Part of the SPSS output

Họ thực sự chỉ quan tâm đến giá trị FSig.. Vấn đề của tôi là tôi không có nền tảng về thống kê, và tôi không thể biết được các bài kiểm tra được gọi là gì, hoặc cách tính chúng.

Tôi nghĩ giá trị F có thể là kết quả của F-test, nhưng sau khi làm theo các bước được cung cấp trên Wikipedia, tôi nhận được kết quả khác với những gì mà SPSS cung cấp.

+0

Ai đó có thể sửa hình ảnh, vi phạm định dạng –

Trả lời

4

This website có thể giúp bạn nhiều hơn một chút. Ngoài ra this one.

Tôi đang làm việc từ một ký ức khá gỉ của một khóa học thống kê, nhưng ở đây đi không có gì:

Khi bạn đang làm phân tích phương sai (ANOVA), bạn thực sự tính toán thống kê F là tỷ lệ từ phương sai trung bình "giữa các nhóm" và phương sai trung bình "trong các nhóm". Liên kết thứ hai ở trên có vẻ khá tốt cho phép tính này.

Điều này làm cho số liệu thống kê F chính xác mức độ mạnh mẽ của mô hình của bạn, bởi vì phương sai "giữa các nhóm" là nguồn giải thích và sai số "trong nhóm" là lỗi ngẫu nhiên. High F ngụ ý một mô hình rất có ý nghĩa.

Giống như trong nhiều hoạt động thống kê, bạn xác định lại Sig. sử dụng thống kê F. Đây là nơi thông tin Wikipedia của bạn có một chút tiện dụng. Những gì bạn muốn làm là - bằng cách sử dụng các mức độ tự do cho bạn bởi SPSS - tìm giá trị P phù hợp mà tại đó F table sẽ cung cấp cho bạn số liệu thống kê F mà bạn đã tính toán. Giá trị P trong đó điều này xảy ra [F (bảng) = F (được tính)] là giá trị quan trọng.

Về mặt khái niệm, giá trị ý nghĩa thấp hơn cho thấy khả năng rất mạnh mẽ để từ chối giả thuyết không (cho các mục đích này có nghĩa là để xác định mô hình của bạn có sức thuyết minh).

Xin lỗi với bất kỳ người tính toán nào nếu điều này là sai. Tôi sẽ kiểm tra lại để thực hiện chỉnh sửa !!!

Chúc bạn may mắn. Số liệu thống kê rất thú vị, có lẽ không phải phần này. =)

+0

Đây là bảng kết quả đa biến - quy tắc ANOVA. Nó có thể là một MANOVA, một phân tích chức năng phân biệt đối xử, hoặc một trong nhiều thử nghiệm đa biến khác. Câu chuyện dài ngắn, số liệu thống kê là khó khăn, làm việc chặt chẽ với các chuyên gia và kịch bản SPSS thông qua python thay vì lăn của riêng bạn. –

2

Thống kê khó :-). Sau một năm đọc và đọc lại sách và giấy tờ và chỉ có thể nói với sự tự tin rằng tôi hiểu những điều cơ bản của nó.

Bạn có thể muốn điều tra các thư viện sẵn sàng cho bất kỳ ngôn ngữ lập trình nào mà bạn đang sử dụng, vì chúng có nhiều điểm chung về toán học nói chung và số liệu thống kê nói riêng (làm tròn lỗi là ví dụ rõ ràng).

Ví dụ, bạn có thể xem the R project, cả môi trường tương tác và thư viện mà bạn có thể sử dụng từ mã C++, được phân phối theo GPL (tức là nếu bạn chỉ sử dụng nó trong nội bộ và chỉ xuất bản kết quả, bạn không cần phải mở mã của mình).

2

Tóm lại: không thực hiện việc này bằng tay, liên kết/sử dụng phần mềm hiện có. Và câu trả lời của sain_grocen là không chính xác.:(

Đây là tất cả các thử nghiệm về tầm quan trọng của các ước tính tham số thường được sử dụng trong phản hồi đa biến Nhiều lần hồi quy.Đây không phải là những điều đơn giản để làm bên ngoài môi trường lập trình thống kê. Chương trình thống kê hiện tại, hoặc sử dụng một chương trình mà bạn có thể liên kết và sử dụng mã đó

Tôi sợ rằng câu trả lời đầu tiên (sain_grocen's) sẽ dẫn bạn đi sai đường dẫn. Anova giải thích trong các liên kết của ông là cho một phản ứng variate duy nhất, trong một thiết kế cân bằng.Đây không phải là số liệu thống kê F bạn đang nhìn thấy Các tên trong đầu ra của bạn (Trace Pillai, Trace của Hotelling, .. .) là một số phiên bản ivariate. Họ có F phân phối theo các giả định nhất định. Tôi không thể giải thích một cuốn sách văn bản có giá trị tài liệu ở đây, tôi khuyên bạn nên bắt đầu bằng cách xem "Phân tích thống kê đa biến được áp dụng" bởi Johnson và Wichern

0

Bạn có thể giải thích thêm tại sao SPSS không phải là giải pháp tốt cho vấn đề? Có phải nó tạo ra các bảng tổng hợp như đầu ra khó thao tác không? Là chi phí của chương trình?

Số liệu thống kê F có thể phát sinh từ bất kỳ số lượng thử nghiệm cụ thể nào. F chỉ là một phân bố (lỏng lẻo: một mô tả về "tần số" của các nhóm giá trị), giống như một Normal (Gaussian), hoặc Uniform. Nói chung chúng phát sinh từ tỷ lệ chênh lệch. Ý kiến: nhiều thống kê (bao gồm cả tôi), tìm các bài kiểm tra dựa trên F không ổn định (biệt ngữ: không mạnh mẽ).

Thống kê đầu ra cụ thể (dấu vết của Pillai, v.v.) cho thấy phân tích ban đầu là ví dụ MANOVA, như các áp phích khác mô tả là một thủ tục phức tạp và khó thực hiện đúng quy trình.

Tôi cũng đoán rằng, dựa trên MANOVA và việc sử dụng SPSS, đây là một dự án tâm lý học hoặc xã hội học ... nếu không, hãy khai sáng. Có thể là các mô hình khác, đơn giản hơn có thể dễ hiểu và dễ lặp lại hơn. Tham khảo ý kiến ​​nhóm tư vấn thống kê của trường đại học địa phương của bạn nếu bạn có.

Chúc may mắn!

3

Tôi giả định từ câu hỏi của bạn rằng các đồng nghiệp nghiên cứu của bạn muốn tự động hóa quá trình mà theo đó một số phân tích thống kê được thực hiện (nghĩa là họ muốn xử lý lô dữ liệu). Bạn có hai tùy chọn:

1) SPSS hiện có thể đọc được thông qua python (như phiên bản 15) - truy cập spss.com và tìm kiếm python. Bạn có thể viết các kịch bản python để tự động phân tích dữ liệu và trích xuất các giá trị khóa từ các bảng tổng hợp và sau đó xử lý các câu trả lời theo bất kỳ cách nào bạn muốn. Điều này có đức hạnh cho phép so sánh chính xác giữa các kết quả từ kịch bản python của bạn và các nỗ lực tính toán tay trong SPSS của các cộng tác viên của bạn. Vì vậy, bạn sẽ không phải thực sự biết bất kỳ thống kê nào để thực hiện công việc này (đó là một lợi thế chính)

2) Bạn có thể thực hiện điều này trong R, một môi trường thống kê miễn phí có thể được viết kịch bản. Điều này có bất lợi là bạn sẽ phải tìm hiểu số liệu thống kê để đảm bảo rằng bạn đang làm nó một cách chính xác.

+0

Điều cần biết là SPSS hiện có thể đọc được bằng Python trực tiếp! Nó có thể xuất kết quả bằng văn bản thuần túy bây giờ không? Ngoài ra, R cũng là kịch bản (mặc dù R hoặc thông qua Python, sử dụng RPy). –

0

Dưới đây là một lời giải thích của MANOVA ouptput, từ một trang web rất tốt về thống kê và trên SPSS:

Output với lời giải thích: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Làm thế nào và tại sao phải làm MANOVA hoặc đa biến GLM: (cùng đường như trên, nhưng kết thúc bằng '/ manova.htm ')

Viết phần mềm từ đầu để tính các đầu ra này sẽ dài và khó; có rất nhiều vấn đề về số và nghịch đảo ma trận để thực hiện.

Như Henry đã nói, hãy sử dụng tập lệnh Python hoặc R. Tôi khuyên bạn nên làm việc với ai đó biết SPSS nếu tập lệnh. Ngoài ra, bản thân SPSS có khả năng xuất các bảng đầu ra ra các tệp bằng cách sử dụng một cái gì đó gọi là OMS. Một tập lệnh trong SPSS có thể thực hiện việc này.

Tìm hiểu ai trong nhóm nghiên cứu của bạn biết SPSS và làm việc với họ.

Các vấn đề liên quan