如何解决如何在TensorFlow中生成自定义批处理数据
我有一个火车数据(数据帧格式),如下所示:
data = pd.DataFrame({
'date': [1,1,2,3,4,4],'feature': [23,24,25,23,22,26,27,21,20,22],'label': [0,5,2]}
)
date feature label
0 1 23 0
1 1 24 1
2 1 25 2
3 1 23 1
4 2 23 0
5 2 22 1
6 2 26 4
7 3 27 5
8 3 21 0
9 3 22 2
10 3 20 3
11 4 23 1
12 4 22 2
我想生成数据批,其中每个批最多包含两个日期,例如,如果batch_size = 2,则生成的批可能像这样:
date feature label
0 1 23 1
2 1 25 2
或者这个:
date feature label
0 3 27 5
2 3 22 2
这:
date feature label
0 1 23 0
2 2 22 1
因此,像tf.data.Dataset.from_tensor_slices
这样的张量流中的当前方法无法满足我的需求,并且tf.data.Dataset.from_generator
似乎也无法批量控制数据,有什么方法可以自定义为batch()
方法来生成批处理数据?
在此可以找到类似的问题:How to generate custom mini-batches using Tensorflow 2.0,such as those in the paper "In defense of the triplet loss"? ,这个问题也没有解决。
如果您能帮助我,我将非常感谢,谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。