如何解决以下功能不会从推文中删除RT标签我想从推文中同时删除“ b”和“ RT”任何帮助将不胜感激
我的数据框的头部看起来像这样
我正在使用熊猫的“ re”库,并且编写了如下代码。
for i in df.index:
txt = df.loc[i]["tweet"]
txt=re.sub(r'@[A-Z0-9a-z_:]+','',txt)#replace username-tags
txt=re.sub(r'^[RT]+',txt)#replace RT-tags
txt = re.sub('https?://[A-Za-z0-9./]+',txt)#replace URLs
txt=re.sub("[^a-zA-Z]"," ",txt)#replace hashtags
df.at[i,"tweet"]=txt
但是,运行此命令不会删除“ RT”标签。另外,我也想删除'b'标签。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。