如何解决获取向量的最后n个元素有没有比使用length函数更好的方法?
| 如果出于参数考虑,我想要Python中10长度向量的最后五个元素,则可以在范围索引中使用\“-\”运算符,这样:>>> x = range(10)
>>> x
[0,1,2,3,4,5,6,7,8,9]
>>> x[-5:]
[5,9]
>>>
在R中执行此操作的最佳方法是什么?有没有一种比我当前使用长度()函数的方法更简洁的方法?
> x <- 0:9
> x
[1] 0 1 2 3 4 5 6 7 8 9
> x[(length(x) - 4):length(x)]
[1] 5 6 7 8 9
>
这个问题与时间序列分析有关,通常仅对最新数据有用。
解决方法
有关某些便捷功能,请参见
?tail
和?head
:
> x <- 1:10
> tail(x,5)
[1] 6 7 8 9 10
为了论证的缘故:除了最后五个元素之外的所有东西都是:
> head(x,n=-5)
[1] 1 2 3 4 5
正如@Martin Morgan在评论中所说,还有另外两种可能性比尾部解决方案要快,以防万一您必须对1亿个值的向量执行一百万次。为了便于阅读,我会选择尾巴。
test elapsed relative
tail(x,5) 38.70 5.724852
x[length(x) - (4:0)] 6.76 1.000000
x[seq.int(to = length(x),length.out = 5)] 7.53 1.113905
基准代码:
require(rbenchmark)
x <- 1:1e8
do.call(
benchmark,c(list(
expression(tail(x,5)),expression(x[seq.int(to=length(x),length.out=5)]),expression(x[length(x)-(4:0)])
),replications=1e6)
)
,单单基于速度而对ѭ8的否决似乎并没有真正强调出,速度较慢的部分原因是尾巴更安全,如果您不确定x的长度是否会超过n
,您要子集化的元素数量:
x <- 1:10
tail(x,20)
# [1] 1 2 3 4 5 6 7 8 9 10
x[length(x) - (0:19)]
#Error in x[length(x) - (0:19)] :
# only 0\'s may be mixed with negative subscripts
尾巴将仅返回最大元素数,而不是生成错误,因此您不需要自己进行任何错误检查。使用它的重要原因。如果使用额外的微秒/毫秒对您来说无关紧要,则代码更安全,更干净。
,您可以在R中使用另外两个字符来执行完全相同的操作:
x <- 0:9
x[-5:-1]
[1] 5 6 7 8 9
要么
x[-(1:5)]
,rev(x)[1:5]
怎么样?
x<-1:10
system.time(replicate(10e6,tail(x,5)))
user system elapsed
138.85 0.26 139.28
system.time(replicate(10e6,rev(x)[1:5]))
user system elapsed
61.97 0.25 62.23
,这是执行此操作的功能,并且看起来相当快。
endv<-function(vec,val)
{
if(val>length(vec))
{
stop(\"Length of value greater than length of vector\")
}else
{
vec[((length(vec)-val)+1):length(vec)]
}
}
用法:
test<-c(0,1,NA,1)
endv(test,5)
endv(LETTERS,5)
基准:
test replications elapsed relative
1 expression(tail(x,5)) 100000 5.24 6.469
2 expression(x[seq.int(to = length(x),length.out = 5)]) 100000 0.98 1.210
3 expression(x[length(x) - (4:0)]) 100000 0.81 1.000
4 expression(endv(x,5)) 100000 1.37 1.691
,我只是在这里添加一些相关内容。我想访问一个带有后端索引的向量,即写类似tail(x,i)
的东西,但返回x[length(x) - i + 1]
而不是整个尾巴。
在评论之后,我对两种解决方案进行了基准测试:
accessRevTail <- function(x,n) {
tail(x,n)[1]
}
accessRevLen <- function(x,n) {
x[length(x) - n + 1]
}
microbenchmark::microbenchmark(accessRevLen(1:100,87),accessRevTail(1:100,87))
Unit: microseconds
expr min lq mean median uq max neval
accessRevLen(1:100,87) 1.860 2.3775 2.84976 2.803 3.2740 6.755 100
accessRevTail(1:100,87) 22.214 23.5295 28.54027 25.112 28.4705 110.833 100
因此在这种情况下,即使对于小的向量,appears8ѭ与直接访问相比也非常慢
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。