NVIDIARTX4070Ti在Octanebench中以大致相同的TFLOPs击败RTX3090Ti

可以最大限度地发挥GPU潜力的基准测试之一是Octanebench。它用于渲染目的,可以最大化图形卡的吞吐量,几乎不需要驱动程序优化。换句话说,您可以将其视为任何给定GPU的最佳案例场景。NVIDIARTX4070Ti最近在Octanebench数据库中被发现(通过LaptopVideo2Go通过Videocardz),并且以5%的优势击败了旧的RTX3090Ti。

现在,由于我们正在处理最大化GPU理论吞吐量的基准测试,因此让我们首先看一下理论数字。RTX3090Ti拥有10,752个主频为1860MHz的CUDA内核,可产生39.99TFLOPs的FP32性能。另一方面,RTX4070Ti有7680个时钟频率为2610MHz的CUDA内核,可产生40.09TFLOPs的FP32性能。

现在Octanebench也可以考虑卡上的RT内核,其中NVIDIARTX4070Ti有60个,而3090Ti有84个。总而言之,RTX3090Ti在纸面上非常接近RTX4070Ti,有趣的是至少有一个基准可以充分利用这一点。

RTX4070Ti得分为725.3分,而RTX3090Ti得分为688.17分(或快5%)。然而,值得注意的是,这个分数是一个组合分数,结果经过大量汇总和加权。我注意到RTX4070Ti在信息通道测试中非常强大(可能是因为升级了VRAM),与RTX3090Ti的697相比,它的得分为953。然而,在直接闪电和路径追踪方面,它的得分大致相同与RTX3090Ti的687和687相比,得分分别为705和696。

这看起来像是NVIDIA的一次相当不错的性能升级,并且从表面上看是RTX3090Ti的可靠替代品。然而,这就是比较失败的地方。有很多与此相关的警告。1)这是渲染测试,不是游戏测试。游戏在很大程度上受驱动程序优化的影响,并且与峰值理论FP32性能仅具有部分相关性。2)我们不知道这里使用的卡片是重度OC版还是原版。在得出任何结论之前,最好有一个更大的样本量。

所有这一切都意味着,在现实世界中,RTX3090Ti在可预见的未来应继续保持比RTX4070Ti更快的总体游戏速度。然而,增加的时钟速度和架构改进可能使它成为渲染爱好者和视频专业人士的理想卡。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!