我对以下空程序运行了perf分析,
#include
编译并运行perf stat ./a.out后,我得到了以下输出说明(以及其他数据,如周期数,任务时钟等):
418,869 instructions # 0.87 insns per cycle
在同一个精灵的每次’perf’分析期间,指令的数量都会发生变化.
我的实际需要是找到我写的特定函数中的指令数.所以我将从新程序中的指令数减去上面的数字.(我可以计算在gcc中使用-S标签创建的program.s中的行数,但在查看perf行为后我感到困惑)
为什么说明的数量不一致,确切地说不一样?
更新
我按照man page中给出的示例在C中使用perf_event_open()
最佳答案
为了测量你的函数执行的指令数量,我建议在函数的进入和退出时使用perf_event_open()开始和停止事件计数,而不是在有和没有函数的情况下运行两次你的程序.
关于空程序执行的指令数的非确定性,您可能正在计算用户和内核域中的事件.我认为用户的土地数应该在两次运行之间保持不变,但对于内核部分,很多事情都发生在执行这个程序的场景后面,所以我猜非确定性来自于内核代码中发生的事情.要仅计算用户空间指令,您可以使用:
perf stat -e instructions:u a.out
你能否提供有关差异的更多细节?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。