测完RTX 4090,性价比高:开得起4K 144Hz高特效,功耗温度还降了

选自techpost

作者:Steven Walton

机器之心编译

编辑:泽南、小舟

顶级游戏大作,全都可以开 4K144Hz 高特效,而且功耗没有增加,现在压力和瓶颈全到了 CPU 上,这就是 RTX 40 时代。

9 月 21 日,英伟达在 GTC 大会上发布了全新架构的 GeForce RTX40 系列,新显卡因为台积电的 5nm 制程,全新光追处理器和 DLSS 3 实现了性能的大幅提升。

在今天凌晨,各家媒体陆续放出了旗舰版本 RTX 4090 的测评文章,看起来最高的这个版本果然和之前英伟达声称的一样性能强大,而且「最有性价比」。

RTX 4090 基于 AD102 芯片,尺寸为 608.4 平方毫米,比 RTX 3080 和 3090 使用的 GA102 小约 3%。从上代 Ampere 的三星 8N 工艺转移到台积电的 4N 工艺,让 Ada Lovelace 架构的 4090 晶体管数量增加了 170%,从 283 亿增加到了疯狂的 763 亿个。

与 RTX 3090 Ti 相比,4090 的流处理器、CUDA 核、Tensor 核及 RT 核和纹理单元增加了 52%。ROP 计数增加了 57%,加速时钟频率提升了 35%。使用的还是相同的 21 Gbps GDDR6X 内存,在 384 位宽的内存总线上仍有 24GB 内存,所以是相同的 1008 GB/s 内存带宽。GPU 还保留了相同的 PCI Express 4.0 x16 接口。

英伟达声称 RTX 4090 的功率额定值为 450W,与 3090 Ti 相同,而最高温度已从 93℃ 略微降低到 90℃ 。最低电源要求为 850W,测试时也用了该功率的电源。

有人还放出了和 X Box X、PS5 对比的照片,是这样的:

散热是稳了,可是也不知道怎么塞进机箱?

在设计方面,Founders Edition 版的 RTX4090 看起来与 3090 相似,但有一些相当明显的变化。最引人注目的是显卡的宽度。3090 的宽度为 52 毫米,而新的 RTX 4090 的宽度为 61 毫米。尽管尺寸有所增加,但两种型号的重量都相同,均为 2190 克。

另外就是 NVLink 连接器的缺失,英伟达已经取消了 NVLink,取而代之的是依赖于 PCIe 4.0 总线。其他的重大变化是已升级到 PCIe 5.0 规范的 16 针电源输入,也称为 super catch 12VHPWR 电源连接器。

单个 PCIe 5.0 电源连接器可提供高达 600W 的功率,而以前需要四个 8 针电源连接器。你不需要更换符合 PCIe 5.0 标准的 PSU,因为 RTX 4090 自带一个 4x8 针到单个 16 针适配器,类似于 3090 Ti 提供的 3x8 针到 16 针适配器。

除了各类核心的数量提升,GeForce 40 还引入了 DLSS 3,这是目前 GeForce 40 系列独有的功能。

这种新的升级 / 帧速率倍增技术令人兴奋,在游戏的测试中可以展示一些结果,但对于 DLSS 3 的全面分析还要继续等待更多数据。DLSS 3 需要大量的测试和分析,这远远超出了首批评测的测试范围。

为了进行测试,所有 GPU 都设置为以官方时钟规格运行,测试平台的 CPU 是 Ryzen 7 5800X3D,在 MSI MPG 上使用 32GB 双列、双通道 DDR4-3200 CL14 内存 X570S Carbon Max WiFi 主板。

游戏基准评测

在「看门狗:军团」(1440p)的游戏测试中,GeForce RTX 4090 似乎并不是非常惊艳的,但它确实是目前为止最快的 GPU——比 6950 XT 提速了约 9%。

RTX 4090 比 RTX 3090 Ti 提速了 22%,这和二者的价格差距相应。在测评中,RTX 4090 的问题似乎不大,反而是测试平台的 CPU 5800X3D 成了系统的主要瓶颈。

因此,测评团队将分辨率提高到 4K 来测试 RTX 4090 的帧率到底有多高,结果发现 4090 比 6950 XT 高了 60%,比 3090 Ti 高了 64%,这才是真正的 4K 的高刷新率游戏体验。

同时,RTX 4090 再次比 3090 Ti 帧率高出 60%,尽管与 Radeon 6950 XT 的差距一直在增长,现在我们看到 AMD 的差距为 102%。

「孤岛惊魂 6」通常在 A 卡上性能更好,在 1440p 时测试平台的 CPU 瓶颈效应严重,使用 RTX 4090 只能获得 9% 的性能提升,平均刷新率为 187 fps。

转换成 4K 分辨率后,RTX 4090 带来了巨大的性能增益,平均刷新率是 164 fps,比 6950 XT 提升了 34%,提升幅度较大,相比于 RTX 3090 Ti 的提升幅度则更大,达到了 50%,比标准 3090 甚至提升了 60%。

「刺客信条:英灵殿」也是一个在 A 卡上运行良好的游戏。测评结果表明,在 1440p 情况下,RTX 4090 的帧率比 6950 XT 高了 27%,这是一个不错的增益,但远不如其他对比提升,并且 RTX 4090 也仅比 3090 Ti 提高了 37%,而不是 4K 时的 60% 增益。

另一款游戏「赛博朋克 2077」,对 CPU 和 GPU 的要求都很高。而安装了 RTX 4090 后,我们几乎可以肯定 CPU 会受到 1440p 的限制。测评结果表明,RTX 4090 在赛博朋克上的平均刷新率为 145 fps,比 6950 XT 高 33%,比 3090 Ti 高 36%。

然而,4K 情况下的性能增益并没有预期那么大,RTX 4090 比 3090 Ti 提升了 51% ,但 RTX 4090 远远超过了 60 fps,这是其他 GPU 远远达不到的。

性能总结

Techspot 的测评共在 13 个游戏上进行了测试,在 1440p 分辨率时,GeForce RTX 4090 的平均性能大致如下:输出帧率为 219 fps,比 6950 XT 高 44%,比 3090 Ti 高 45%。

这些都是巨大的提升,但仍不能完全说明 RTX 4090 的优秀性能,因为测试过程中系统的 5800X3D 多次受限,尽管 5800X3D 已经是一个非常快的游戏 CPU 了。这说明目前最快的游戏 CPU 之一仍然会在 1440p 情况下给 RTX 4090 造成严重的性能瓶颈。

在 4K 游戏中,GeForce RTX 4090 平均比 RTX 3090 Ti 高 59%,比 6950 XT 高 71%,这些都是巨大的提升。同样令人印象深刻的是,RTX 4090 在 4K 时的平均帧率为 145 fps,正好是很多高刷显示器的上限。这确实是第一款能够提供高刷新率游戏体验的 4K GPU。

此外,使用 Ryzen 7 5800X3D 在 1080p 时,RTX 4090 比 3090 Ti 高 28%,比 6950 XT 高 24%。

光追和新一代 DLSS

赛博朋克 2077 是首批支持 DLSS 3 的游戏之一,下面来看看它的表现。请注意,这只是初步的评测。

在使用高质量预设的 1440p 时,RTX 4090 在赛博朋克中的平均帧率为 145 fps,比 3090 Ti 和 6950 XT 高约 35%。但是,启用 DLSS 3 后性能提高了 90%,达到 276 fps。

DLSS 3.0 的真正优势可以在启用超高质量光线追踪的情况下看到,此处 RTX 4090 在低分辨率的平均帧数为 191 fps,比 DLSS 2 高了近 70%。然后在 4K 时,GeForce RTX 4090 开 DLSS 3 输出了 113 fps,比 DLSS 2 提升了 43%。

功耗

摩尔定律终结之后,提升芯片性能的方式经常是增加功耗,这一点在旗舰 GPU 上尤为明显。测试者尝试以 1440p 玩「光环:无限」观察总系统功耗,可看到 RTX 4090 实际上并没有想象的那么糟糕。事实上它的性能比 RX 3090 Ti 高 50%,同时功耗更低。RTX 4090 和 3090 Ti 都是 450W 显卡,所以从技术上讲,它们的功耗应该差不多。

测试使用的 RTX 3090 Ti 将总系统使用率提高了约 50W,因为市面上并没有 3090 Ti 的 Founders Edition,这里使用的是使用高于规格电压的 MSI 非公版。尽管已将其降频至官方版本的规格,这在性能方面降低了几个百分点,但更高的电压意味着功耗仍然高于基本型号。

下面来看看 RTX 4090 的能效如何,通过将帧速率锁定在 90 fps,我们可以看到每个 GPU 使用了多少功率。

固定帧率后,RTX 4090 仅消耗 215W,这意味着对于相同水平的性能,3090 Ti 需要多消耗 93% 的功率,而 6950 XT 需要多 40% 的功率。因此,尽管人们都在谈论 RTX 4090 会功耗爆炸,但它在效率方面实际上是非常令人印象深刻的。

散热

在冷却方面,FE 版的 RTX 4090 在安装在 ATX 机箱内且门关闭的 21℃ 房间内经过一个小时的高负载运行后,热点达到了 83℃ 的峰值。GPU 的平均温度达到了 72℃ 的峰值,内存温度达到了 84℃ 的峰值,考虑到运行的内容的话,所有这些都是可以接受的。

另外,风扇转速仅为 1600 RPM,运行音量仅为 42 dBA,比过去测试过的大多数高端甚至中端显卡都要安静。在这个测试中,核心时钟速度相当稳定地保持在 2730 MHz,内存运行在 21 Gbps,最后 GPU 功耗平均为 415W。

性价比

对于性价比,我们的使用每帧成本进行分析,看起来 RTX 4090 与 Radeon 6950 XT 和 6900 XT 水平大致相当,但比我们认为的 RTX 3080 和 6800 XT 中上一代高端 GPU 的合理选择成本高出 30% 以上 — 实际上它比 6800 XT 贵了约 50%。

如果对比的是实际售价,RTX 4090 的吸引力就降低了。在 1440p 分辨率下性价比要比 3090 Ti 略差,使其成为市场上每帧成本和整体价格最昂贵的 GPU。

4090 显然在 4K 分辨率下的效率更高,在这里我们看到它比 6950 XT 稍微好一点,也比折扣后的 RTX 3090 略好,这对于高级产品来说是相当不错的。

不过 3070 等中高端的显卡总是可以提供更高的性价比。

总结

GeForce RTX 4090 显然是块非常快的 GPU,人们对于它的主要担忧是定价和功耗。很明显,它相比上一代功耗没有增加。另一方面,由于性能提升幅度很大,它的效率也增加了。你可以看到,当限制帧速率时,RTX 4090 在游戏时消耗的功率比 3090 Ti 少近 50%,比 6950 XT 少近 30%。

不过这只是新世代的一个开端:在更多 RTX 40 Ada Lovelace GPU,当然还有与之竞争的 AMD RDNA3 GPU 出现之前,很难说 RTX 4090 是不是最具性价比的那一个。

但如果不计较是否交了智商税的问题,RTX 4090 作为显卡是值得赞赏的,这是我们第一次能在不影响视觉效果的情况下享受真正的 4K 高刷新率游戏体验。光线追踪终于成为了一种无忧无虑的选择,虽然 DLSS 仍然很重要,但在 4K 下享受超高质量光线追踪的游戏,如赛博朋克 2077、看门狗,同时帧速率保持在 60 fps 以上是一种特殊的体验。

DLSS 3 是一个令人兴奋的新功能,但我们需要深入研究它,然后才能进一步评论它的价值。

当然,这只是对于公版进行的评测,我们在仅使用原先的 Corsair RM850x 850w PSU 的情况下正常运行了 4090,FE 卡在满负荷下长时间运行非常安静,不比优质的中档显卡更吵,而且功耗并不高。

这并不是说 RTX 4090 适合所有人。它的价格超过一万块钱,不过如果你决定购买 4090 的话应该不会有太多麻烦,库存显然很充足。

对于大多数人来说,使用一半价格,或是四分之一价格的 GPU 来享受游戏才是正常情况,我们可以等待 RTX 4070,当然还有 AMD 即将推出的 RDNA 3 系列。

参考内容:

https://www.theverge.com/23398201/nvidia-rtx-4090-review-test-benchmark

https://www.techspot.com/review/2544-nvidia-geforce-rtx-4090/

原文地址:https://www.toutiao.com/article/7153509431098081795/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340