如何解决在以下情况下如何隔离火车测试数据
学习python进行数据分析时,我遇到了一个问题
我有一个如下生成的数据框-
xtrain,xtest,ytrain,ytest = train_test_split(np.array(x),all_total['link'],test_size = 0.3,random_state = 35)
具有更多行。
我想应用监督机器学习来预测链接列。独立值是u1和u2列中的作者姓名,jaccard,adamic,p和pref。
但是,由于我不能直接使用作者名称,因为它是字符串,并且必须是浮点型,而且作者之间的联系必须显而易见,因此我尝试使用node2vec并将其应用于节点。
现在,我想将train-test-split设置为:
{{1}}
我希望我的np.array(x)是应用于u1和u2列以及jaccard,adamic,p和pref的node2vec的组合。
但是,我不知道该怎么做。
如果有人可以帮助我,那真的很棒。
谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。