2013-05-23 42 views
5

A là mảng 4 chiều có độ mờ 100 * 100 * 100 * 100. Tôi muốn chọn 10.000 ma trận phụ từ hai kích thước cuối cùng của A. B và C là vectơ có chiều dài 10000. Chúng là các tiêu chí lựa chọn. B chỉ định số hàng của A và C chỉ định số cột.R, chọn dãy ma trận phụ từ mảng chiều cao

A <- array(rnorm(100^4), dim=c(100,100,100,100)) 
B <- sample(nrow(A) , 10000 , repl = TRUE) 
C <- sample(ncol(A) , 10000 , repl = TRUE) 
D <- array(0, dim=c(10000,100,100)) 

Với vòng lặp for:

system.time(
for (i in 1:10000){  
    D[i,,] <- A[B[i],C[i],,] 
}) 

user system elapsed 
10.20 0.14 10.34 

với mapply:

sub_array <- function(b,c) return(A[b,c,,]) 
system.time(D <- mapply(FUN = sub_array, B, C, SIMPLIFY='array')) 

user system elapsed 
9.77 3.75 29.17 

mà thậm chí còn chậm hơn. Có cách nào nhanh hơn để làm điều đó không? Cảm ơn.

Trả lời

2

Bí quyết là làm mờ lại A thành mảng 3D để bạn có thể sử dụng thứ mà chúng tôi gọi là lập chỉ mục "bình thường".

Một số dữ liệu mẫu:

n <- 60 
A <- array(rnorm(n^4), dim=c(n,n,n,n)) 
B <- sample(nrow(A) , n^2 , repl = TRUE) 
C <- sample(ncol(A) , n^2 , repl = TRUE) 
D <- array(0, dim=c(n^2,n,n)) 

phương pháp OP của:

system.time({ 
    D <- array(0, dim=c(n*n, n, n)) 
    for (i in 1:(n*n)) D[i,,] <- A[B[i],C[i],,] 
}) 
# user system elapsed 
# 2.33 0.08 2.41 

giải pháp Đề xuất:

system.time({ 
    d <- dim(A) 
    dim(A) <- c(prod(d[1:2]), d[3:4]) 
    D2 <- A[B + d[1]*(C-1),,] 
}) 
# user system elapsed 
# 0.37 0.06 0.44 

Và chúng tôi kiểm tra xem kết quả là giống hệt nhau:

identical(D, D2) 
# [1] TRUE 
Các vấn đề liên quan