AMD通过新的GPU小芯片专利推动优化游戏中的着色器

摘要 AMD最近发布了一项专利,用于将渲染负载分散到多个GPU小芯片上。游戏场景被划分为单独的块并分配给小芯片,以优化游戏中着色器的利用率。为

AMD最近发布了一项专利,用于将渲染负载分散到多个GPU小芯片上。游戏场景被划分为单独的块并分配给小芯片,以优化游戏中着色器的利用率。为此使用了两级小芯片分箱。

AMD发布的这项新专利为该公司计划在未来几年内使用下一代GPU和CPU技术做什么提供了更多见解。在6月底,有54项专利申请被披露将被发送公开。AMD的计划中将使用已发布的50多项专利中的哪一项尚不得而知。专利中讨论的应用详细介绍了公司在接下来几年的方法。

社区成员@ETI1120在ComputerBase网站上注意到的一项应用程序(专利号US20220207827)分两个阶段讨论了关键图像数据,以有效地将来自GPU的渲染负载传递到许多小芯片上。CPU最初于去年底将此应用到专利局。

当GPU上的图像数据通过标准方式光栅化时,着色器单元(也称为ALU)执行相同的任务并为各个像素分配颜色名称。反过来,在特定游戏场景中的特定像素处发现的纹理多边形直接映射到像素上。最后,制定的任务将保持非典型原则,并且仅通过位于不同像素的其他纹理而有所不同。这种方法称为SIMD,或单指令-多数据。

对于当前的大多数游戏,着色并不是GPU产生的唯一任务。但相反,在初始着色之后包含了几个后处理元素。例如,GPU将添加的动作将是游戏环境的抗锯齿、阴影和遮挡。然而,光线追踪与着色一起发生,创造了一种新的计算方法。

在谈到当前游戏中的GPU控制图形时,计算机产生的负载呈指数增长到数千个计算单元。

在GPU上的游戏中,这种计算负载以某种理想的方式扩展到数千个计算单元。这与处理器的不同之处在于,必须专门编写应用程序才能添加更多内核。CPU调度程序创建此操作,将来自GPU的工作拆分为由计算单元处理的更易消化的任务,也称为分箱。游戏中的图像被渲染,然后分成包含一定数量像素的单独块。该块由图形处理器的子单元计算,然后在其中同步和创建。在该动作之后,等待计算的像素被包含在一个块中,直到图形卡的子单元最终被使用。考虑了着色器的计算能力、内存带宽和缓存大小。

AMD在专利中解释说,分割和合并需要GPU的所有元素之间进行彻底和完整的数据连接,这会带来问题。不在裸片上的数据链接具有较高的延迟水平,从而导致过程变慢。

由于能够通过多个内核发送任务,CPU可以毫不费力地过渡到小芯片,从而使其可供小芯片访问。GPU不提供同样的灵活性,将它们的调度程序与入门级双核处理器相媲美。

AMD认识到需要并尝试通过更改光栅化管道并在多个GPU小芯片(类似于CPU)之间发送任务来解决这些问题。这需要先进的分箱技术,该公司正在引入“两级分箱”,也称为“混合分箱”。

在超分箱中,分割被处理成两个单独的阶段,而不是直接处理成逐像素块。第一步是计算方程,采用3D环境并从原始图像创建二维图像。该阶段称为顶点着色,在光栅化之前完成,该过程在GPU的第一个小芯片上非常少。完成后,游戏场景开始分箱,发展为粗分箱并处理成单个GPU小芯片。然后,可以开始执行光栅化和后处理等日常任务。

目前尚不清楚AMD打算何时开始使用这一新工艺或是否会获得批准。然而,它让我们得以一窥更高效的GPU处理的未来。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。