如何解决如何在Python列表中将带单引号的字符串元素转换为双引号
我正在为NLP任务预处理数据,需要以以下方式构造数据:
[tokenized_sentence]标签[tags_corresponding_to_tokens]
我有一个文本文件,其中包含数千行这种格式的文件,其中两个列表之间用制表符分隔。这是一个例子
['EU','rejects','German','call','to','boycott','British','lamb','.'] ['I-ORG','O','I-MISC','O']
我用来获取代码的那段代码是
with open('data.txt','w') as foo:
for i,j in zip(range(len(text)),range(len(tags))):
foo.write(str([item for item in text[i].split()]) + '\t' + str([tag for tag in tags[j]]) + '\n')
其中 text 是包含句子的列表(即每个句子是一个字符串),而 tags 是标签的列表(即与每个单词/标记对应的标签一个句子就是一个列表。
在保持此结构的同时,我需要使列表中的字符串元素具有双引号而不是单引号。预期的输出应如下所示
["EU","rejects","German","call","to","boycott","British","lamb","."] ["I-ORG","O","I-MISC","O"]
我曾尝试在Python的json.dump()
模块中使用json.dumps()
和json
,但没有获得所需的预期输出。相反,我将两个列表作为字符串。我最大的努力是手动为标签添加双引号
for i in range(len(tags)):
for token in tags[i]:
tkn = "\"%s\"" %token
print(tkn)
给出输出
"I-ORG"
"O"
"I-MISC"
"O"
"O"
"O"
"I-MISC"
"O"
"O"
"I-PER"
"I-PER"
.
.
.
但是,这似乎效率太低。我已经看到了这些相关问题
- Convert single-quoted string to double-quoted string
- Converting a Text file to JSON format using Python
但是他们没有直接解决这个问题。
我正在使用Python 3.8
解决方法
我很确定没有办法强迫python用双引号写字符串。默认为单引号。正如@deadshot所评论的那样,您可以在将整个字符串写入文件后将'
替换为"
,或者在写入每个单词时手动添加双引号。 this帖子的答案有许多不同的处理方式,最简单的是f'"{your_string_here}"'
。不过,您将需要分别编写每个字符串,因为编写列表会在每个项目周围自动添加'
,这将是非常意大利面条。
将字符串写入文件后,只需执行find and replace ' with "
。
您甚至可以使用python做到这一点:
# after the string is written in 'data.txt'
with open('data.txt',"r") as f:
text = f.read()
text = text.replace("'",'"')
with open('data.txt',"w") as f:
text = f.write(text)
根据以下OP的评论进行编辑
执行此操作,而不是执行上述操作;这应该可以解决大多数问题,因为它会搜索字符串','
,希望该字符串仅出现在一个字符串的末尾和下一个字符串的开头
with open('data.txt',"r") as f:
text = f.read()
# replace ' at the start of the list
text = text.replace("['",'["')
# replace ' at the end of the list
text = text.replace("']",'"]')
# replace ' at the item changes inside the list
text = text.replace("','","')
with open('data.txt',"w") as f:
text = f.write(text)
(由OP编辑)根据我的最新评论进行的新修改
运行此解决了我在注释中描述的问题,并返回了预期的解决方案。
with open('data.txt',"')
text = text.replace("',",')
text = text.replace(",',"w") as f:
text = f.write(text)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。