如何解决CSV解析:根据条件拆分行数据
我正在尝试将CSV文件解析为python中的特定格式。
文件如下:
iteration_number,iteration_name,Gb_sec,trans_sec,usec,usec
1,tcp_stream-64B-1i,0.5908,2,tcp_stream-64B-8i,4.6030,4,tcp_stream-16384B-1i,9.6810,5,tcp_stream-16384B-8i,20.0800,7,tcp_rr-64B-1i,22040.0000,45.4600,8,tcp_rr-64B-8i,144000.0000,55.5600,10,tcp_rr-16384B-1i,12440.0000,80.4900,11,tcp_rr-16384B-8i,75580.0000,105.9000,
在这种情况下,我每个Gb_sec,trans_sec和usec都有2列,但是它可以是N个列,这意味着每个标头可以有1-N列。但这对于提及的指标总是相等的。
我想要实现的是将该文件解析为python列表。如下所示,这是我希望数据使用的格式:
[
[""],[system_name],[tcp_stream-64B],[instance count,Gb_sec],[1i,0.5908]
[8i,4.6030]
[""],[tcp_stream-16384B],9.6810],[8i,20.0800],[""],[tcp_rr-64B],trans_sec]
[1i,22040.0000]
[8i,144000.0000],usec],45.4600],55.5600],.......
到目前为止,到目前为止,我能够解析文件并获取所需的格式,但是我无法在保持所需的python列表格式的同时将同一行中的trans_sec和usec分为不同的列表。如果列数是恒定的,那么我可以通过说row [:2]和row [3:]来对行进行切片并馈送到不同的列表,但是我对如何在执行此操作时保持格式感到困惑。任何提示都将非常有帮助。
到目前为止,这是我所需要的,无需trans_sec和usec分隔即可工作:
results = []
with open(path) as csv_file:
csv_reader = csv.DictReader(csv_file)
iteration_name = []
for index,row in enumerate(csv_reader):
instance_result = [row['iteration_name'].split('-')[2]]
header_row = ['instance count']
# pop failed runs
if 'fail' in row['iteration_name']:
continue
# remove empty values
row = {k: v for k,v in row.items() if v is not '' and k is not None}
if iteration_name != row['iteration_name'].split('-')[:2]:
header_row += [i.split(':')[0] for i in list(row.keys())[2:]]
iteration_name = row['iteration_name'].split('-')[:2]
results.append([""])
results.append([system_name])
results.append(["-".join(iteration_name)])
results.append(header_row)
instance_result += list(row.values())[2:]
results.append(instance_result)
return results
谢谢。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。