如何解决创建一个以单词为键的字典,并将它们在文档中的计数作为数据框中文本的值
我正在尝试构建一个函数,该函数接受数据框中的一列并返回一个包含单词及其计数的数据框
def word_count(dataframe):
masterlist=[]
masterset={}
for ask in masterlist:
masterset[ask]=0
corpus_length=len(dataframe)
for i in range(0,corpus_length):
cleaned_sentence=sentence_cleaner(dataframe[i])
tweetlength=len(cleaned_sentence)
for j in range(0,len(cleaned_sentence)):
w=dataframe[i][j]
if w in masterset:
masterset[w]=masterset[w]+1
if w not in masterset:
masterlist.append(w)
masterset[w]=1
print('completed')
word_countdataframe=pd.DataFrame(masterset)
return(word_countdataframe)
解决方法
为什么不做这样的事情?
import pandas as pd
df = pd.DataFrame({'word':['cat','dog','fish','cat','fish']})
df.word.value_counts()
返回:
cat 2
fish 2
dog 1
Name: word,dtype: int64
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。