如何使用openpyxl在Python中将一个Excel文件的列值与另一个Excel文件的列值进行比较?

如何解决如何使用openpyxl在Python中将一个Excel文件的列值与另一个Excel文件的列值进行比较?

我能够读取两个Excel文件的列数据。下面是我的代码:-

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]

for val1 in sheets:
    print(val1[0].value)

print("\n\n\n\n")

for val2 in anotherSheet:
    print(val2[0].value)

我需要将Book1的列的每个值与Book2的列的每个值进行比较。我对如何进行比较感到困惑。如果值匹配,那么我可以添加另一列并输入“是”,如果不匹配,则可以输入“否”。换句话说,我只需要检查Book2的Book1的Column中是否存在值。一些帮助将不胜感激。

解决方法

我不知道完整的答案,但我想您可以对数组取值并一一比较它们

,

最后,找出解决方案。

首先,我们需要创建3个列表来存储book1,book2和tempList中的值以存储匹配的值。

from openpyxl import load_workbook

book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")

sheets = book['Sheet1']
anotherSheet = book2["sheet1"]
book1_list = []
book2_list = []
tempList = []

接下来,我们还想跳过列的标题并存储在新变量中。

skip_Head_of_anotherSheet = anotherSheet[2: anotherSheet.max_row]

然后遍历工作表,并将所需列的值附加到它们各自的列表中(在我的情况下为'0',这意味着第一列)。

for val1 in sheets:
    book1_list.append(val1[0].value)

for val2 in skip_Head_of_anotherSheet:
    book2_list.append(val2[0].value)

检查列表中的重复项,并删除所有重复的值。

book1_list = list(dict.fromkeys(book1_list))

存储列表的长度以进行调试

length_of_firstList = len(book1_list)
length_of_secondList = len(book2_list)

接下来,遍历两个列表并检查它们是否匹配,然后将匹配的值存储到tempList

for i in book1_list:
    for j in book2_list:
        if i == j:
           tempList.append(j)
           #print(j)

现在,该编辑我们的Excel工作表了。我们将迭代存储在tempList中的匹配值,并找到实际excel工作表中的那些值。当我们检测到相同的值时,我们将通过标识该特定行的索引,将YES标记到excel工作表的第4列,即“ D”列。此外,如果“ D”列中的单元格为空,则将标记NO

for temp in tempList:
    for pointValue in skip_Head_of_anotherSheet:
        if temp == pointValue[0].value:
            anotherSheet.cell(column=4,row=pointValue[0].row,value="YES")
            #print(pointValue[0].row)

        if pointValue[3].value is None:
            anotherSheet.cell(column=4,value="NO")

最后,我们将在新填充的列中添加标题,并保存我们的excel工作表并打印所需的信息以进行调试。

anotherSheet.cell(column=4,row=1,value="PII")
book2.save("Book2.xlsx")

print("SUCCESSFULLY UPDATED THE EXCEL SHEET")
print("Length of First List = ",length_of_firstList)
print("Length of Second List = ",length_of_secondList)

我希望这会对遇到同样问题的人有所帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 <select id="xxx"> SELECT di.id, di.name, di.work_type, di.updated... <where> <if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 <property name="dynamic.classpath" value="tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-