网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月12日漏签0天
ati吧 关注:52,081贴子:640,788
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 51回复贴,共1页
<<返回ati吧
>0< 加载中...

AMD RDNA4 GPU可以解决显存带宽不足的问题

  • 只看楼主
  • 收藏

  • 回复
  • 显卡预测橘
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
AMD从RDNA2 GPU开始引入IF缓存用于提高有效显存带宽,IF缓存越大,IF缓存带宽越高,由于IF缓存命中率会随着IF缓存增加而增加,所以大缓存会有很高的有效带宽。高分辨率会导致IF缓存命中率降低。
RDNA3 GPU均有显存带宽不足的问题:
RDNA3的MCD中集成了第二代IFC,理论上带宽很高,但因为NAVI31和NAVI32由于chiplet封装有问题,导致实际显存带宽受限于chiplet d2d的带宽,这在RX7800XT和7900GRE上很明显,IFC相对RDNA2反而倒退了。
NAVI33就是把NAVI23的计算单元替换成RDNA3架构,工艺提升到TSMC N6,其他的都不变,IF缓存还是第一代。
RDNA4这下是单芯片设计了,如果用第二代IFC,就会有很高的有效显存带宽。


  • 显卡预测橘
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
NAVI31和NAVI32的廉价chiplet封装可能是导致其显存带宽不足的原因。
die to die走pcb板,像桌面端CPU那样,带宽被限制的死死的,ZEN4和IOD的单个GMI总线(桌面端是1个GMI,EYPC是2个GMI)带宽最高也不超过100G/s。
NAVI31和NAVI32用的是廉价的chiplet封装,走的是金属互联,如果封装没有搞好,寄生电容、d2d连接之间的干扰会导致实际带宽出现很严重的降低,但比PCB板要好多了。
走cowos那种高级封装,各种非理想因素少很多,带宽很高。
当然单芯片设计,信号直接在芯片内部传输,带宽是最高的,各种干扰、串扰也是最小的。


2025-08-12 03:25:16
广告
不感兴趣
开通SVIP免广告
  • 孤影照惊鸿
  • Vega
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
cowos成本还是太高了,而且就两个大die互联才有优势,RDNA3的RDL互联上挺好的 GCD和MCD单个互联带宽都有900GB/S已经是足够用了,RDNA3的问题更多是GCD上的,双发射FP32模式实际表现有问题,而且TEX ROP这些的规模提升不大,游戏表现提升和RDNA2相比不大也主要是因为这个。
实际上对于MCD的问题我认为更大,MCD的面积是很小的,作为显存和GCD之间的中转,最大问题是片上缓存的容量太小,只有16MB/die,如果增加到24 32MB面积和成本提升都不大,但是能改善不小的问题,甚至于实现shader重排这样的功能,对于GPU的ALU利用率的提升是巨大的。
RDNA3还有一个问题就是规模太小,GCD的面积才300mm2左右,明明可以做到500mm2左右的,规模可以提升个75—80%左右,那就从原来的6144sp提升到10752—12280sp之间,在规模上就能比AD102多20%左右,实现对NV的反超。当然AMD是一以贯之的扣门。
RDNA4就无所谓了 上MCM两GCD互联提升规模,性能表现看的过去就完事了,反正AMD自己也没啥心气的。


  • 冰棘刃
  • x850xt
    11
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
为什么高分辨率会影响if缓存命中率


  • 显卡预测橘
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
RDNA4 GPU预测


  • 显卡预测橘
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
RDNA2、RDNA3、RDNA4 GPU的显存带宽,数据来源于AMD官网
其中NAVI32虽然官网宣称带宽很高,但实际上NAVI32的IPC低于NAVI21,因此可以推测NAVI32的实际显存带宽低于NAVI21,原因可能是chiplet封装
NAVI48的实际显存带宽应该就能达到NAVI32宣称的水平了


  • gangan2008
  • Vega
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
RNDA3的问题是结温高,显存温度高,而不是带宽问题,带宽你可以设置512bit,36gb就够


  • 风舞雩咏而归
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
这是amd的宣传图,说不上实际能不能达到这个速度


2025-08-12 03:19:16
广告
不感兴趣
开通SVIP免广告
  • 别名-叶实
  • Vega
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
从微星的板卡设计我猜测,本来微星是准备给AMD这一代上很好的用料超频干烂4080,摸4090屁股的,芯片理论数据很好,但是加上mcd的es送到了工厂里,才知道原来是拉了坨大的,pcb已经定型号了没办法,所以给了个上代6900xt的一模一样的散热器打发了事儿,这是唯一一个pcb上用了钽电容的型号,还有就是微星的7900xt,7800xt,7700xt不见踪影,显然知道AMD是什么货色了。还有是华硕的三8pin tuf7900xtx 那么恐怖的散热模组,结果呢,430w!xtx的多芯片设计的愚蠢可见一斑。


  • 孤影照惊鸿
  • Vega
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
你们自习看RDNA的部分这缓存站的面积也太大了,往后延续的话RDNA3起码也是不会看缓存的,不然会导致很多问题。
最大一个问题是这么多缓存对PPAC影响很大,而且rdna的WGP SP规模也不大整这么多缓存干嘛。。第二张图是摩尔的S30,即使对BXT乱改一通,ALU集群的FP32规模都砍半了,那也没有那么多缓存需求阿 AMD这够怪的,搞不懂整那么多缓存干嘛,而且实际表现上还烂了(指rdna3)



  • 骁龙2212
  • HD3870x2
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
目前5600xt挺爽的,功耗低,战三年换6600xt


  • 天天越策越
  • Vega
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
一直搞不懂无限缓存这个概念,到底能够提升百分多少带宽。后面不说没有软件针对优化干脆取消了。


  • rabzju
  • x1950xtx
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
rdna3的本质问题还是不舍得堆料&过于普信,正常chiplet技术要用也应该局限于384bit的顶级显卡,256bit及以下完全可以一个die搞定


  • rabzju
  • x1950xtx
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
另外这次navi31/32根本没加分区隔断导致上不了高频,而navi33的规模太小了(好吧,6nm也不能指望多大的规模)


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 51回复贴,共1页
<<返回ati吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示