Có một số phương pháp thống kê để giảm tập dữ liệu lớn thành tập dữ liệu hình ảnh nhỏ hơn, dễ dàng hơn. Nó không rõ ràng từ câu hỏi của bạn thống kê tóm tắt mà bạn muốn. Tôi đã giả định rằng bạn muốn xem tỷ giá hối đoái thay đổi như thế nào theo thời gian, nhưng có lẽ bạn quan tâm đến tần suất tỷ giá hối đoái vượt trên một giá trị nhất định hoặc một số thống kê khác mà tôi không xem xét.
Tóm tắt một xu hướng theo thời gian
Dưới đây là một ví dụ sử dụng phương pháp lowess trong R (từ tài liệu trên scatter plot smoothing): điều khiển f
> library(graphics)
# print out the first 10 rows of the cars dataset
> cars[1:10,]
speed dist
1 4 2
2 4 10
3 7 4
4 7 22
5 8 16
6 9 10
7 10 18
8 10 26
9 10 34
10 11 17
# plot the original data
> plot(cars, main = "lowess(cars)")
# fit a loess-smoothed line to the points
> lines(lowess(cars), col = 2)
# plot a finger-grained loess-smoothed line to the points
> lines(lowess(cars, f=.2), col = 3)
Tham số cách chặt chẽ các hồi quy phù hợp để dữ liệu của bạn. Sử dụng một số chu đáo với điều này, như bạn muốn một cái gì đó mà chính xác phù hợp với dữ liệu của bạn mà không overfitting.Thay vì tốc độ và khoảng cách, bạn có thể vẽ tỷ giá hối đoái so với thời gian.
Cũng dễ dàng truy cập vào kết quả làm mịn. Dưới đây là cách thực hiện:
> data = lowess(cars$speed, cars$dist)
> data
$x
[1] 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 16 16 17 17 17 18 18 18 18 19 19
[38] 19 20 20 20 20 20 22 23 24 24 24 24 25
$y
[1] 4.965459 4.965459 13.124495 13.124495 15.858633 18.579691 21.280313 21.280313 21.280313 24.129277 24.129277
[12] 27.119549 27.119549 27.119549 27.119549 30.027276 30.027276 30.027276 30.027276 32.962506 32.962506 32.962506
[23] 32.962506 36.757728 36.757728 36.757728 40.435075 40.435075 43.463492 43.463492 43.463492 46.885479 46.885479
[34] 46.885479 46.885479 50.793152 50.793152 50.793152 56.491224 56.491224 56.491224 56.491224 56.491224 67.585824
[45] 73.079695 78.643164 78.643164 78.643164 78.643164 84.328698
Đối tượng dữ liệu mà bạn lấy lại chứa các mục có tên x và y, tương ứng với giá trị x và y được chuyển vào hàm lowess. Trong trường hợp này, x và y đại diện cho tốc độ và khoảng cách.
Nguồn
2010-04-02 21:35:21
bạn có thể làm rõ "đại diện" - ý của bạn chỉ là trực quan, hoặc với mục đích thực hiện tính toán? – Carl
Kết quả cuối cùng sẽ là tập dữ liệu của một loại mà sau đó có thể được xử lý và vẽ đồ thị – Karl
Âm thanh như một công việc cho R! – Joel