如何解决在python中从数据框的列表名到列名查找相似的匹配项
我有一个“净额”可能列名称的列表,即
list1 = ['total amount','total cash','net amount']
我有一个数据框,其实例的列名称为
df.columns = ['accounts receivables ffa','net amount of the year','cash refunded','payement']
我想将list1
的可能名称与{{1}匹配,将'net amount'
与df
匹配,它应该获取我“年的净额”
将list1
与df.columns
匹配,并从df中获得与列名相似的匹配
有什么建议吗?
预先感谢
解决方法
您可以使用https://pypi.org/project/pyjarowinkler/
from pyjarowinkler import distance
import pandas as pd
df = pd.DataFrame( [],columns=['accounts receivables ffa','net amount of the year','cash refunded','payement'])
lst1 = ['total amount','total cash','net amount']
for item in lst1:
for col in df.columns:
if distance.get_jaro_distance(item,col) >0.85:
print(item,";",col)
,
如何遍历列表和列名。然后检查列表项(字符串)是否是列名的子字符串(也是字符串)。
for el in list1:
for col_name in df.columns:
if el in col_name:
print(col_name)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。