栏目分类

你的位置:kai云体育app官方下载app最新版本-kai云体育app官方登录入口 > 新闻中心 > 开云kaiyun但已升级到更快的速率-kai云体育app官方下载app最新版本-kai云体育app官方登录入口

开云kaiyun但已升级到更快的速率-kai云体育app官方下载app最新版本-kai云体育app官方登录入口

发布日期:2026-04-23 13:26    点击次数:105

开云kaiyun但已升级到更快的速率-kai云体育app官方下载app最新版本-kai云体育app官方登录入口

(原标题:AMD RDNA 4 架构,深度领路)

如若您但愿不错陆续碰面,迎接标星保藏哦~

开首:执行编译自wccftech,谢谢。

AMD 终于公布了其下一代 RDNA 4 GPU 架构的齐全架构细节,该架构是专为 Radeon RX 9000 系列构建的。

自上一代RDNA 3 过火升级版 RDNA 3.5推出以来,AMD 的 RDNA 4 架构一直备受期待。固然 RDNA 4 架构不会有任何超等发热友 SKU,但它如实带来了全新的变化,应该会擢升游戏性能,因为它主要为游戏玩家蓄意。

因此,AMD 对 RDNA 4 带来了以下新变化:

针对高端游戏责任负载进行了高度优化

提高光栅化和计较遵守

光泽跟踪性能的要紧检阅

全面的高性能 ML 复旧

增强统统责任负载的带宽遵守

为游戏玩家和创作家提供多媒体检阅

与 RDNA 2 比拟,RDNA 4 GPU 的光栅化性能擢升了近 2 倍,光泽跟踪性能擢升了近 2.5 倍,每个计较单位的 ML(FP16 密集矩阵)责任负载擢升了 3.5 倍。接下来,咱们将深切辩论 RDNA 4 架构框图的构建块,望望整个芯片是怎样组合在通盘的。

RDNA 4 的新中枢 IP

RDNA 4 GPU 架构的中枢构建块是计较引擎。

新的计较单位配备双 SIMD32 矢量单位和增强矩阵运算,其中包括:

2x-16b 和 4x-8b/4b 密集矩阵速率

4:2 结构化寥落性,兑现 +2 倍速率

新的 8b 浮点数据类型

带转置的矩阵负载

RDNA 4 还带来了新的着色检阅,RDNA 4 着色不错动态分拨寄存器。它们不错在需要时从池中央求寄存器。它们不错在完成这项责任后将寄存器开释回池中,何况软件会在分拨恭候时代时料理要求。这不错更好地处理内存蔓延,同期分享中枢的举座遵守不错权臣提高。

在标量单位方面,您不错取得新的 Float32 操作,同期诊治更新包括拆分和定名樊篱、加快溢出/填充操作和检阅的教唆预取。

然后咱们有第三代光泽跟踪单位,提供双倍的光泽交叉率、检阅的 BVH 压缩、加快的光泽遍历和着色以及定向鸿沟框。这些新的光泽跟踪中枢提供了芯片上最大的性能擢升之一。每个光泽加快器也得到了检阅:

2x 盒子和三角形交叉单位

硬件实例改换

检阅 RT 堆栈料理

BVH8 和检阅的节点压缩

定向鸿沟框

这些新的光泽跟踪升级还大大缩小了 BVH 的内存要求。平均而言,获利于 8 宽蓄意,RDNA 4 可将内存要求缩小至 RDNA 3 的 60% 以下。

但这并不是全部。AMD 还履行了一种新的惩办决策,通过对每个框进行旋转编码来更良好地绑定所包含的几何图形,从而缩小遍历资本,同期将框与几何图形对皆不错匡助拔除大部分空间,何况射线方针在参预框时会进行改换以匹配编码的旋转。这不错减少遍历法子,通过拔除遍历热门来缩小峰值资本,并将遍历性能提高 10%。

这些变化的终结是,与 RDNA 3 比拟,RDNA 4 CU 在疏通的时钟速率和带宽下提供了 2 倍的光泽遍历性能。

还有一个检阅的大喊处理器,它具有增强的数据包加快器。缓存也得到了升级,当今愈加均衡,具有高达 64 MB 的第三代 Infinity Cache、8 MB 的 L2 缓存和 2MB 的团聚 CU 缓存。在内存方面,RDNA 4 GPU 架构保留了对 GDDR6 的复旧,但已升级到更快的速率,最高可达 20.00 Gbps,容量高达 16 GB,并配有 256 位总线接口。RDNA 4 还承袭了增强的内存压缩技巧来松开可用带宽的压力。

关于 AI,AMD 正在愚弄其第三代矩阵加快引擎,该引擎具有检阅的张量密集率、新的 8b 浮点数据类型、结构化寥落性复旧和基于 ML 的升级或超隔离率。

与 RDNA 3 比拟,RDNA 4 CU 在 FP16 的圭臬场景中将图像生成性能提高了 2 倍(SDXL 1.5)。

媒体引擎承袭双宽度蓄意,配备更新的编码/解码引擎,AVC、H.264、H.265 质料擢升高达 25%,AV1 糊涂量翻倍,并针对低蔓延流媒体进行了优化。临了,还有更新的 Radiance 败露引擎,它当今复旧 DisplayPort 2.1a、HDMI 2.1b 输出和更新的缩放和锐化引擎。

RDNA 4 框图(顶部 Navi 48 芯片)

接下来,咱们转到代表齐全 Navi 48 GPU SKU 的 RDNA 4 框图。RDNA 4 GPU 承袭台积电 4nm 工艺节点制造,具有多达 539 亿个晶体管,SKU 尺寸为 356.5mm2。该芯片还完全相宜 PCIe Gen5 圭臬。

当今是时候隔断 RDNA 4 芯片了。Navi 48 GPU(Radeon RX 9070 XT)由四个着色器引擎构成,每个引擎都包含多个“双计较单位”,而不是 WGP。每个双计较单位都有两个计较单位,每个着色器引擎统共有 8 个 DCU 或 16 个 CU。芯片自己统共有 32 个 DCU 或 64 个 CU,统共有 4096 个流处理器或着色器单位。

每个 DCU 都有两个光泽加快器引擎,每个着色器引擎统共有 16 个 RA,统共有 64 个 RA,而每个 DCU 还包含 4 个矩阵加快引擎,每个着色器引擎统共有 32 个 MA,统共有 128 个 MA。每个着色器引擎还包含四个 RB+ 块、一个光栅化器引擎和一个 Prim Unit 块。芯片外围有四个第三代无穷缓存部分和四个 4x16 位内存适度器。

L2 缓存位于 GPU 的正中间,其中还包括两个 Geometry 处理器、两个 ACE 单位以及 HWS 和 DMA 各一个。该芯片使用 Infinity Fabric 连合。

AMD 的翌日之路

在 PC 游戏鸿沟,光泽跟踪庸碌被视为过期的术语。天然,它是一种跟踪光泽的神气,不错使场景看起来更传神,何况刚刚开动在游戏机鸿沟取得柔和,但竞争敌手庸碌使用另一种类型的光泽跟踪器,称为旅途跟踪。固然光泽跟踪使用单个主光泽在光源上投射反射、暗影和折射,但旅途跟踪使用统统可能的光泽旅途,何况是一种更奋斗的技巧。

NVIDIA 的旅途跟踪技巧在《赛博一又克 2077》或《心灵杀手 II》等游戏中可见一斑,这些游戏被视为对图形要求最高的游戏之一,而且画面遵守也统统令东说念主咋舌。通过升级和帧生成等新技巧,旅途跟踪得以兑现,但 Green 团队还投资了一项名为“光泽重建”的全新技巧,该技巧通过移除引擎内的降噪器并使用 AI/ML 匡助从头评估和重建图像,匡助更灵验地兑现旅途跟踪。

看起来 AMD 也承袭了这种次第,并承袭我方的神经超等采样和去噪技巧来兑现 RDNA 4 的旅途跟踪功能。

升级的媒体和败露功能

如若不指摘媒体和败露引擎,咱们就弗成收尾此次深切探讨。因此,率先,咱们率先先容新的媒体引擎,它通过以下神气提供增强的游戏流媒体和录制功能:

H.264 低蔓延编码质料擢升 25%

HEVC 编码质料擢升 11%

B 帧提高了 AV1 编码遵守

720p 编码性能擢升高达 30%

针对 FFMPEG、OBS 和 Handbrake 进行了优化

VCN 低功耗视频播放(AV1 和 VP9 性能擢升 50%)

败露体验也得到了改善,增强的 FreeSync 电源优化方式可在大大都双败露器设置中提供更低的安静功率,硬件翻转队伍复旧可将视频帧诊治卸载到 GPU 并节俭 CPU 功率以进行视频播放,而 Radeon 图像锐化 2 可提供高质料的图像和场景,并通过单个切换在统统 API 上责任。

https://wccftech.com/amd-rdna-4-architecture-deep-dive-new-compute-units-raytracing-cores-ai-enhancements-path-tracing/

半导体杰作公众号推选

专注半导体鸿沟更多原创执行

柔和专家半导体产业动向与趋势

*免责声明:本文由作家原创。著作执行系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或复旧,如若有任何异议,迎接联系半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第4050期执行,迎接柔和。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的执行就点“在看”分享给小伙伴哦



上一篇:开云kaiyun官方网站少量点消磨着彼此间的情切与信任-kai云体育app官方下载app最新版本-kai云体育app官方登录入口
下一篇:开云kaiyun.com需要超高带宽和低延伸的存储-kai云体育app官方下载app最新版本-kai云体育app官方登录入口