我正在尝试从Pandas中的多索引数据框创建一个自举样本.下面是一些生成我需要的数据的代码.
from itertools import product import pandas as pd import numpy as np df = pd.DataFrame({'group1': [1,1,2,3],'group2': [13,18,20,77,109,123],'value1': [1.1,3,4,5,6],'value2': [7.1,8,9,10,11,12] }) df = df.set_index(['group1','group2']) print df
df数据框如下所示:
value1 value2 group1 group2 1 13 1.1 7.1 18 2.0 8.0 20 3.0 9.0 2 77 4.0 10.0 109 5.0 11.0 3 123 6.0 12.0
我想从第一个索引中获取一个随机样本.例如,假设随机值np.random.randint(3,size = 3)产生[3,2].我希望结果数据框看起来像:
value1 value2 group1 group2 3 123 6.0 12.0 2 77 4.0 10.0 109 5.0 11.0 2 77 4.0 10.0 109 5.0 11.0
我花了很多时间研究这个,我一直无法找到一个类似的例子,其中多索引值是整数,二级索引是可变长度,主索引样本是重复的.这就是我认为引导的适当实现可行的方式.
解决方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。