如何解决如何使用python中的部分匹配条件映射来自不同数据集的值
希望根据条件语句将值从 dataframe2 映射到 dataframe1。需要将 df2 的值映射到 df1,其中基于 df1['id_number'] 和 df2['identity_No'] 值的匹配百分比最高。
例如:如果来自 df1 的 row1 将基于特定列匹配 df2 的所有行,并且具有最高匹配百分比 wrt。 df2 的第 4 行,超过 75%,将各自的数据复制到 df1。
数据框 1
[ERR]: "Executed JavaScript Failed:"
[ERR]: Cannot read property 'toString' of undefined
Dataframe2
score id_number company_name company_code match_acc action_reqd
20 IN2231D AXN pvt Ltd IN225 Yes
45 UK654IN Aviva Intl Ltd IN115 No
65 SL1432H Ship Incorporations CZ555 Yes
35 LK0678G Oppo Mobiles pvt ltd PQ795 Yes
59 NG5678J Nokia Inc RS885 No
20 IN2231D AXN pvt Ltd IN215 Yes
我需要检查匹配准确率百分比,例如。 df1 ("id_number") 中的 row1 将根据最高匹配百分比(df2 中的任何行将具有最高匹配百分比)与 df2 (identity_No) 中的每一行匹配,将值从 df2 映射到 df1。 df1的每一行都一样。
预期输出:
OR_score identity_No comp_name comp_code
51 UK654IN Aviva Int.L Ltd IN515
25 SL6752J Ship Inc Traders CZ555
79 NG5678K Nokia Inc RS005
20 IN22312 AXN pvt Ltd IN255
38 LK0665G Oppo Mobiles ltd PQ895
我一直在尝试的代码
score id_number company_name company_code match_acc action_reqd
20 IN22312 AXN pvt Ltd IN225 90 Yes
51 UK654IN Aviva Int.L Ltd IN115 100 No
25 SL1432H Ship Incorporations CZ555 30 Yes
38 LK0665G Oppo Mobiles ltd PQ795 80 Yes
79 NG5678K Nokia Inc RS885 85 No
没有得到预期的答案。它将 row1 从 df2 复制到 df1 的整行,其中 match_acc >=75。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。