如何解决从数据中删除²符号
Helloo,所以我目前正在使用熊猫清理数据。
我使用以下代码
import pandas as pd
#buat lowercase
baca = pd.read_csv('E:\coba8.csv',encoding='utf-16')
#periksa = baca.DataFrame(baca,columns = ['Comment'])
#df=baca["Comment"].str.lower()
#ilangin simbol
df1=baca["Comment"].str.replace('[^\w\s]','')
#ilangin angka
df2=df1.str.replace('\d+','')
#ilangin enter
df3=df2.str.replace('\n',' ',regex=True)
df=df3.str.lower()
df.to_csv('newcoba8_5.csv',index=False)
print(df)
结果已经令我满意,但在某些行中却出现了这个奇怪的人物
²
包含字符的行的示例
banyak orang² dari luar yang mudik di jawa timur sihmasyarakat orang² di surabaya bandel² apalagi yang nyangkruk di warkop bagi laki ato perempuan
biarkan saja jd no biar orang² yg susah di bilangin ngerasain akibatnya di daerahku orang² masih beraktifiras seperti biasa tarawih jumatan waktu di masjid dll tanpa pake masker masih berdempetan
源文件中的行
Banyak orang² dari luar yang mudik di jawa timur sih+masyarakat orang² di Surabaya bandel² apalagi yang nyangkruk di warkop bagi laki ato perempuan
Biarkan saja jd no 1,biar orang² yg susah di bilangin ngerasain akibatnya. Di daerahku orang² masih beraktifiras seperti biasa,tarawih,jum'atan,5 waktu di masjid,dll,tanpa pake masker & masih berdempetan.
有什么办法可以使该角色消失?
解决方法
我认为您在读取数据时使用了错误的编码。您可能应该使用印尼语ASCII代码页。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。