如何解决创建一个Python函数,用另一个列的值替换一个列的值
我试图在Python中创建一个函数,每次我想基于另一个列的值在数据框中创建新列时都可以使用该函数。因此,我想使其尽可能通用。
例如,我有以下只有一个列的数据框示例:
我使用以下脚本根据'D2_1'的值创建一个名为'image_1'的新列:
old_value=[1,2]
new_value=[5,3]
dix={k: v for k,v in zip(old_value,new_value)}
test['image_1']=test['D2_1']
test.loc[~test['D2_1'].isin(old_value),'image_1'] = 0
test=test.replace({'image_1': dix})
此脚本可以找到并且新的数据框如下所示:
然后,我尝试根据上述脚本制作一个泛型函数。我的功能如下:
def create_column(existing_column,new_column,dataset,old_value,new_value):
dataset[new_column]=dataset[existing_column]
dataset.loc[~dataset[existing_column].isin(old_value),new_column] = 0
dix={k: v for k,new_value)}
dataset=dataset.replace({column: dix})
该函数在以下行之前均能正常工作:dix = {k:v for k,v in zip(old_value,new_value)}。但是不会替换基于dix的新列的值。谁能帮我理解为什么?
解决方法
您可以使用.replace()
df["image_1"] = df["D1_1"].replace({1:5,2:3})
输出:
D1_1 image_1
0 1 5
1 1 5
2 1 5
3 3 3
...
11 2 5
12 2 5
如果您希望将其用作功能:
def create_column(existing_column,new_column,dataset,old_new_dict):
dataset[new_column] = dataset[existing_colum].replace(old_new_dict)
return dataset
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。