如何解决使用python选择Excel文件中的行
我有一个Excel文件,我想从中选择行集并为每个选择创建一个带有工作表的新文件。该选择将基于A列中单元格的某些值。到目前为止,我已经编写了一个代码,为我提供了一个元组列表,其中包含将用于设置我要选择的行的单元格。就像这样:
[(<Cell 'CELL'.A1>,<Cell 'CELL'.A18>),(<Cell 'CELL'.A18>,<Cell 'CELL'.A33>),(<Cell 'CELL'.A33>,<Cell 'CELL'.A46>)]
我尝试过类似的事情:
df_init = pd.read_excel(excel_file)
print(df_init)
for i in tuple_list:
wb = Workbook()
ws = wb.active
print(i[0])
df_init=df_init[df_init['ColumnName'].between(i[1],i[0],inclusive=False)]
但是虽然它给了我一个结果,但我得到的数据帧是空的。有人可以帮忙吗?
解决方法
由于熊猫最终无法加载excel模块,请改用 openpyxl 。只需用 pandas 提供的内容替换.column_letter
,.column
或.row
。
我的策略是从给定的单元格范围中获取行,列,您可以使用切片简单地提取单元格。
from openpyxl import load_workbook
work_book = load_workbook("source.xlsx")
work_sheet = work_book.active
select_range = [
(work_sheet['A'][1],work_sheet['A'][3]),(work_sheet['B'][2],work_sheet['B'][3])
] # simulation of OP's range tuple
print(f"Will extract data in range: {select_range}\n")
for start_cell,end_cell in select_range:
# slice from cells in work_sheet at start_cell's column.
data = work_sheet[start_cell.column_letter][start_cell.row - 1:end_cell.row]
# Do some data manipulation,saving etc. Just printing out result here.
print(f"Data: {data}")
输出:
Will extract data in range: [(<Cell 'Sheet1'.A2>,<Cell 'Sheet1'.A4>),(<Cell 'Sheet1'.B3>,<Cell 'Sheet1'.B4>)]
Data: (<Cell 'Sheet1'.A2>,<Cell 'Sheet1'.A3>,<Cell 'Sheet1'.A4>)
Data: (<Cell 'Sheet1'.B3>,<Cell 'Sheet1'.B4>)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。