2012-11-26 40 views
8

Tôi đang tạo ứng dụng web cần tính toán thống kê trên tập dữ liệu. Tôi cần tính toán percentiles, trung bình, chế độ và các chức năng thống kê khác trên mảng.Tính toán số liệu thống kê về mảng

Thông thường trong Python, tôi sẽ chỉ sử dụng scipy, numpy, hoặc nltk trong đó có một thư viện khổng lồ các chức năng mảng stat. Có đá quý hoặc thư viện ruby ​​nào tôi có thể sử dụng để làm điều này không?

Trong trường hợp không có bất kỳ thư viện hiện có nào, có cách nào dễ dàng để xử lý dữ liệu bằng Python trong khi vẫn giữ ứng dụng của tôi trong Ruby/Rails không?

+0

Có [Sciruby] (http://sciruby.com) thực sự, mặc dù chưa hỗ trợ nhiều cho stat. Và nó không phải là rất tích cực bây giờ. Tôi đoán ruby ​​vẫn còn quá chậm để tính toán. – halfelf

Trả lời

7

Nếu bạn thực sự cần thư viện thống kê đầy đủ, hãy xem statsample. Nếu không, bạn có thể tìm thấy descriptive_statistics để trở thành một lựa chọn tốt, nhẹ.

+0

Tôi đang gặp sự cố khi sử dụng descriptive_statistics bên trong đường ray vì nó có vẻ như xác định tổng cho Enumerable (over-riding phiên bản đường ray) đang gây rối AR. – slykat

+0

Nevermind, tôi thấy rằng có thể được giải quyết với yêu cầu 'descriptive_statistics/safe' – slykat

1

Bạn có thể sử dụng Rubystats hoặc Easystats. Tôi chắc rằng có nhiều đá quý hơn tôi không biết.

0

Đối với việc giới hạn số Narray là đề xuất chuẩn. Đó là các phương pháp thống kê là Summation, Cumulative Summation, Product (Multiply elements), tích lũy sản phẩm, Mean, độ lệch chuẩn, Root mean square, Root mean average deviation, Minimum, Maximum và median.

Chuyên về số, nó là claimed để tối đa nhanh hơn 50 lần và nhiều bộ nhớ tham chiếu hiệu quả hơn.

0

Nếu bạn đang tính toán thống kê trên các mô hình ActiveRecord thì có thể bạn sẽ muốn xem đá quý statistics.

Tôi cũng đã đánh dấu trang statisticus cung cấp tích hợp GNU-R và SIRB để sử dụng trong bảng điều khiển.

Có vô số cách để chạy Python dưới ứng dụng Rails nhưng có thể dễ dàng tìm thấy các phương thức bạn cần trong thư viện Ruby.

0

Tôi đã triển khai một Gem mới - MDArray thống kê trong JRuby. Điều này có thể thực sự khá tốt cho một ứng dụng web, như JRuby về cơ bản là Java. MDArray sau NArray và triết lý Numpy và độ cao tại thời điểm này nó có lẽ là chậm hơn cả hai, nó phải được nhanh hơn so với một thay thế Ruby tinh khiết.

Hãy khám phá và nếu bạn cần trợ giúp, tôi sẽ rất vui khi được thử và trợ giúp.

Chúc mừng,

Rodrigo

0

Bạn có thể sử dụng NMatrix, mà là một thư viện số tương tự như NumPy trong sự phát triển liên tục. (từ chối trách nhiệm: Tôi thuộc nhóm SciRuby/NMatrix)

Các vấn đề liên quan