如何解决命名dict键,以便在python中快速查找
| 我将拥有1个小词典(5到20个键之间),对于python 2.5中的一页加载,该词典最多可以引用一百次左右。 我开始命名将要查找的键,我想知道是否可以遵循键命名约定来帮助确定查询时间。解决方法
我不得不测试;-)
使用
f1,整数键
1
f2短弦,\"one\"
f3长弦\"aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa\"
作为长度为4的字典的键之一。迭代10,000,000次并测量该时间。我得到这个结果:
<function f1 at 0xb779187c>
f1 3.64
<function f2 at 0xb7791bfc>
f2 3.48
<function f3 at 0xb7791bc4>
f3 3.65
即没有区别...
我的密码
, 对于他们来说,可能有一些明智的名称,恰好会产生其哈希没有冲突的名称。但是,CPython字典已经是已知Universe中最优化的数据结构之一,对于大多数输入几乎不产生冲突,可以与其他内置类型的哈希方案配合使用,非常快地解决冲突等。您极不可能即使您找到了任何东西,也不会发现任何好处,尤其是因为一百次查找的次数并不多。
例如,这个timeit基准运行在我使用了4年的台式机上(运行3.1 GHz的低预算双核CPU,可笑):
...>python -mtimeit --setup=\"d = {chr(i)*100: i for i in range(15)};\\
k = chr(7)*100\" \"d[k]\"
1000000 loops,best of 3: 0.222 usec per loop
这些字符串比手动将其作为变量名手动键入的所有内容大十二倍。将长度从100减少到10导致每次查找为0.0778微秒。现在,测量页面的加载速度并进行比较(或者,只需考虑构建页面时实际要花多长时间);并考虑缓存,框架开销以及所有这些因素。
在这方面,您所做的任何事情都不会影响性能,周期和句号。
, 因为Python字符串哈希函数会遍历字符(至少在仍然适用时),所以我会选择短字符串。
, 要添加另一个方面:
对于很小的字典和沉重的时序约束,计算散列的时间可能占整个时间的大部分。因此,对于(比如说)5个元素,使用数组和顺序搜索(当然,包含在某些MiniDictionary对象中)可能更快,甚至可以通过二进制搜索来增强。这可能会发现具有2-3个比较的元素,这可能会或可能不会比哈希算术加一个比较快。
收支平衡取决于哈希速度,元素的平均数量和预期的哈希冲突次数,因此需要进行一些测量,并且没有“一刀切”的答案。
, Python字典为字符串键提供了快速路径,因此请使用它们(而不是元组)。字符串的哈希值将缓存在该字符串中,因此,字符串保持相同的值比其实际值更为重要。字符串常量(即在程序中逐字出现而不是计算结果的字符串)始终保持完全相同,因此只要您使用它们,就不必担心。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。