如何解决py-datatable用NaN
在python数据表中,我想用NaN替换空字符串。当我尝试时,出现以下错误。它可与熊猫一起使用。预先感谢您的帮助。
我尝试过的数据表语法:
dt[:,"column_name"].replace('',np.nan)
收到错误:
不能用类型
的值替换字符串值''
有效的熊猫语法:
pd["column_name"]=pd["column_name"].replace('',np.nan)
解决方法
Py数据表语法,用于根据其值更新(替换)列之一:
import datatable as dt
mydt = dt.Frame(a=['a','b','c','','d','e'])
mydt[dt.f.a == '',dt.update(a = None)]
更新前的数据表:
mydt
| a
-- + --
0 | a
1 | b
2 | c
3 |
4 | d
5 | e
更新后的数据表:
mydt
| a
-- + --
0 | a
1 | b
2 | c
3 | NA
4 | d
5 | e
适用于0.10.0或更高版本
奖励答案:要实现相反的效果-使用函数isna()
用某些常量值替换缺失值:
mydt = dt.Frame(a=['a',None,'e'])
mydt[dt.isna(dt.f.a),dt.update(a = 'NULL')]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。