如何解决如何获得单词长度的出现? Python3
遇到另一个问题。因此,我正在尝试制作一个字典,其中的键是单词长度,值是从文本文件中读取具有该长度的单词的时间。
我的代码:
words = new_text.split()
w_dict = {}
w_list = []
for c in words:
if len(c) not in w_dict.fromkeys(range(0,1000)):
w_dict[len(c)] += 1
else :
w_dict[len(c)] = 1
w_list = sorted(w_dict.items(),key = lambda x: x[0])
w_final_dict = dict(w_list)
print(w_final_dict)
我的输出:
{1: 1,2: 1,4: 1,5: 1}
我的示例文本为“你好,我叫凯特”。基于此,我知道它会进行迭代并检查是否存在与文本匹配的单词长度,因为在输出中没有带有len(3)
的单词。但是有2 len(4)
和2 len(5)
,所以我不明白为什么它没有增加。任何帮助都会很棒。预先感谢!
解决方法
我认为您代码中的问题是此检查:
if len(c) not in w_dict.fromkeys(range(0,1000)):
您只想检查w_dict
,而不是fromkeys
的结果(我认为这是一本全新的字典)。
但是您可以使用collections.Counter
一行完成全部操作:
>>> new_text = "hello my name is kate"
>>> from collections import Counter
>>> Counter(map(len,new_text.split()))
Counter({2: 2,4: 2,5: 1})
Counter
为其构造函数采用一个可迭代项,并生成一个dict,其中可迭代项中的每个项都是键,而值是该值出现的次数。 map(len,new_text.split())
为我们提供了字符串中所有单词长度的可迭代长度,因此将其传递给Counter
将为我们提供所需的计数字典。
您的if
陈述的逻辑有问题
您的情况if len(c) not in w_dict.fromkeys(range(0,1000)):
函数w_dict.fromkeys(range(0,1000))生成如下输出:
{0: None,1: None,2: None,3: None,4: None,5: None,.... .... 999:None}
因此您无法使用检查逻辑的方式进行检查
因此条件if len(c) not in w_dict.fromkeys(range(0,1000)):
将始终为FALSE
,并且永远不会增加计数,并且通过评估1
部分将覆盖计数保持为else
这就是为什么您获得输出{1: 1,2: 1,4: 1,5: 1}
正确的解决方案
将您的条件更改为此
if w_dict.get(len(c)):
.get(key)
是词典的内置函数之一,它根据键的存在返回值。而且它不会生成KEY ERROR
。
如果密钥存在=>返回存储在该密钥上的value
=>这将使条件 TURE
如果密钥不存在=>返回None
关键字=>这将使条件 FALSE
所以您会得到理想的结果
始终记住-在处理字典中的键时使用.get(key)
功能
请参阅网上的词典教程,以了解有关如何迭代和检查条件的更多信息
希望这会帮助您清除疑虑:)
,保持简单。检查len(word)
是否作为密钥存在于dict
中并添加到计数中。
如果不存在,请创建键值对。
string = 'hello my name is Kate'
data = {}
for word in string.split():
if len(word) not in data:
data[len(word)] = 1
else:
data[len(word)] += 1
输出:
>>> data
{5: 1,2: 2,4: 2}
,
之所以看不到2个len(4)
和2个len(5)
键值,是因为python不允许字典中有重复的键。
python中的键用作唯一标识符。通过复制,您会产生歧义。如果您尝试添加一个键值对,但是键已经存在,Python会简单地用新值更新字典中键的值。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。