我有以下代码:
for file_name,content in corpus.items():
print('here')
content = [list(filter(lambda index: index not in remove_indices,content))]
corpus[file_name] = np.array(content).astype(np.uint32)
语料库是80万个长字典,带有字符串键和数组值。
事情花了很多时间,所以我决定通过添加该print语句来检查每次迭代的速度。
如果我注释最后两行,它会非常快速地打印出许多here
,因此我的迭代器没有问题。真正奇怪的是,当我取消对最后两行的注释时,here
的打印时间很长,即使是第一行!就像print语句以某种方式知道其后的行。
我想我的问题不言而喻。如果有帮助,我在Jupyter笔记本中。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。