如何解决Python在DictVectorizer之后保留原始列
我需要对几个分类列进行编码,为了将来使用,我需要同时将原始列保留在数据框中。如果原始数据帧看起来像这样(请注意,第0行和第4行具有相同的分类值):
Index color taste price
0 Red Good 10$
1 Red Bitter 5$
2 Green Good 10$
3 Red Bitter 2$
4 Red Good 35$
结果数据框应如下所示:
Index color taste price color=Red color=Green taste=Good taste=Bitter
0 Red Good 10$ 1 0 1 0
1 Red Bitter 5$ 1 0 0 1
2 Green Good 10$ 0 1 1 0
3 Red Bitter 2$ 0 1 0 1
4 Red Good 35$ 1 0 1 0
如何使用dictvectorizer来做到这一点(我需要同时编码几个分类列,并避免与必须使用dictvectorizer的错误索引合并)?而且,如果不能使用dictvectorizer进行除霜,还有另一种方法可以做到这一点吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。