如何解决为什么组合多个生成器显示同一进程的不同时间
我有一个 child
函数可以迭代 1000000
次。现在,当我在两个不同的函数上调用该子函数时。它显示每次执行所需的时间不同。为什么会这样?
import timeit
def child():
for i in range(1_000_000):
yield i
def slow():
yield from child()
def fast():
yield from child()
baseline = timeit.timeit(
stmt='for _ in slow(): pass',globals=globals(),number=50
)
comparision = timeit.timeit(
stmt='for _ in fast(): pass',number=50
)
print(f'Manual nesting {baseline:.2f}s')
print(f'Composed nesting {comparision:.2f}s')
输出
# First execution
Manual nesting 9.94s
Composed nesting 9.35s
# Second execution
Manual nesting 9.20s
Composed nesting 9.77s
正如您已经看到的上述输出。它显示不同的时间间隔。为什么同样的进程会发生这种情况?
解决方法
任何 Python 函数在每次运行时都会花费不同的时间,彼此接近但略有不同。原因有很多:
- 您的操作系统(Windows、Linux 等)有许多进程和线程。每个进程和线程被安排只运行一小段连续时间,通常是几毫秒,然后进程/线程切换到另一个。这意味着您的执行过程可能会在中间暂停,然后在操作系统重新安排它的一段时间后继续。所以运行程序不是连续的过程。
- 每个现代 CPU 每次执行每条指令的时间也不同。有不同的预测算法和缓存算法以及乱序执行和前瞻缓冲区等。所有这些都会导致每条小指令的执行时间略有不同。
- CPU 内核可能会改变其运行速度、频率。有时它们会减速(过热时)或短时间加速(涡轮频率)。这意味着在每次运行时,CPU 核心速度可能会在随机时间点发生变化。
- 此外,每次函数运行完成后,Python 的执行环境也略有不同。例如,内存管理器可能有不同的空闲内存块列表(另一个长度、其他大小的块等),因此为每个执行内存分配的单个 Python 指令分配每个 Python 对象将花费不同的时间,而 Python 会执行很多。
- 此外,Python 可能会在后台运行额外的服务线程,它们也会占用主进程执行时间的不同部分。因为 GIL,它会在任何单个 Python 线程运行时阻塞所有其他线程。
- 此外,如果您的函数对输入不是确定性的(而您的函数是确定性的),那么它在每次运行时可能会运行不同的时间,因为它基本上执行不同的操作码序列。
所有这些以及更多原因使整个 Python 执行系统在时间上不可预测,这意味着每次运行的函数在时间上都会有细微的(有时甚至是巨大的)差异。
即使不仅对于 Python,而且对于在计算机上运行的任何程序,大多数这些原因都是适用的,并且任何程序在每次执行时的速度都会有所不同。我想可能存在一些特殊的编程语言,可以将每个指令/操作码的执行同步到某个高分辨率时钟,例如在火星着陆航天器上,每个功能的执行可能需要精确到纳秒。那么对于用这种语言编写的程序,时间安排几乎是精确的。但不适用于 Python,它在运行操作码时不做任何时间同步。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。