如何解决一个热编码一个 2 分类变量
对于具有两个类别的变量,它们是否需要进行 One Hot Encoded?在我的数据集中,我有一个二进制变量为 1 或 0。我需要在我的模型的管道中转换该变量还是保持原样?
variable = np.array([0,1,0]).reshape(-1,1)
ohc = OneHotEncoder()
ohc.fit(variable)
解决方法
如果你的变量已经是二进制的(只有两个类:0和1),你可以说这个变量已经是One Hot Encoded了,所以你不需要再用Sklearn函数OneHotEncoder
。
此外,一般来说,如果二进制变量是分类变量,则必须使用 LabelEncoder
将其转换为数值。无论如何,在你的例子中,你的变量已经是数字了。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。