我写了一个内核模块来检查CR4.PCIDE,它没有设置.为什么
Linux不使用这样的功能来降低由于TLB无效和缓存污染导致的性能下降?
解决方法
注意:我不是Linux开发人员
对于英特尔的“进程上下文标识符”,限制为4096个ID.这意味着当有超过4096个进程需要管理它们(例如,可能会做一个“最近最少使用”的事情,以便如果当前没有ID的进程需要执行,那么该ID将从一些其他过程和重用).
另一件事就是多CPU系统上的“TLB击落”.这些可能有点贵,所以人们做点技巧来避免它们.例如,如果一个进程只有一个线程,那么它只能在一个CPU上运行,并且您知道不需要向其他CPU发送IPI(中断它们并要求他们执行“TLB shotdown”).一旦你开始使用PCID,你就不能确定其他CPU还没有TLB条目,也不能做这些技巧来避免“TLB击倒”.这也意味着(理论上说,对于PCID支持不佳),您从PCID获得的性能可能会低于由于不必要的TLB拍摄和ID管理开销而损失的性能,导致净损失.
大多数我所说的是,添加对PCID的支持有点复杂(这不是你可以在CR4中设置一个标志,而是忘记它).你必须做一些研究(实验,原型,基准测试)来确定最有效的实现方法.对于一个大/复杂/旧的内核(如Linux),它会变得更加复杂,因为你必须小心,不要意外地打扰别的东西.另一件事就是这个功能是比较新的(如果我记得正确的话,它只存在几年),并且很多CPU都不支持(比如任何一个老一点,还有AMD的任何东西).
基本上,我认为它归结为“时间与效益”(或者,在有限数量的CPU上没有足够的时间进行小的性能改进).
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。