如何解决将文本列的行分成多行
我有一个像这样的数据集: how the dataset looks like
我想要的是将状态信息列及其名称分开,以创建一个新列,一个用于显示当前名称,另一个用于其各自的注释,然后相应地填充其余的列,如下所示:
我能够清除标点符号和数字的文本,并从状态信息列中创建一个字典,其名称为键,注释为值,但是它仍然显示所有名称的全部内容。
这是我到目前为止尝试过的代码:
names = ['tom','robin']
months = ['jan','feb','mar','apr','may','jun','jul','aug','sep','oct','nov','dec','january','february','march','april','june','july','august','september','october','november','december']
a = data['Status information'][3].lower()
b = [char for char in a if char not in string.digits]
b = ''.join(b)
for i in months:
if b.find(i) != -1:
b= b.replace(i,' ')
for i in string.punctuation:
if b.find(i) != -1:
b= b.replace(i,' ')
x={}
for i in names:
if b.find(i) != -1:
x[i] = b.split(i)
print(b)
print(x)
输出:
tom i want only server robin cal busy robin reg for server
{'tom': [' ',' i want only server robin cal busy robin reg for server'],'robin': [' tom i want only server ',' cal busy ',' reg for server']}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。