设计芯片时考虑到云和边缘

Renee James 了解处理器,也了解云。在英特尔超过 28 年的职业生涯中,她晋升为这家芯片巨头的总裁,同时还负责管理公司内的一系列部门,包括 HPC、软件和云。

她于2017年离开英特尔创立了AmpereComputing,这是众多芯片制造商之一,这些制造商正在构建针对快速变化的IT环境进行优化的处理器,该环境从中央数据中心延伸到云端,再延伸到边缘,并越来越重视因素。超越芯片性能,包括延迟、功效和平台可扩展性。

该公司收购了 Applied Micro 的资产,该公司是开发基于低功耗 Arm 架构及其 X-Gene 芯片的处理器的先驱之一,此后推出了80 核 Altra 芯片,并于去年推出了 128 核芯片。 Altra Max,这两款芯片均基于 Arm 的 Neoverse 设计。现在,该公司计划今年推出一款 5 纳米芯片,该芯片将基于其自己的内部 Arm 兼容内核。

几十年来,詹姆斯一直是英特尔架构以及该公司在摩尔定律驱动下改进芯片的坚定支持者。然而,计算环境正在发生变化。不仅它越来越分布式和基于云,而且企业使用的开发工具和软件也在发生变化。开发人员正在使用微服务、容器和 Kubernetes 控制器等工具。处理器设计和架构也需要改变,以跟上组织在采用云和边缘时不断变化的需求。

“我们如何知道我们正处于计算的新阶段?” Ampere Computer 现任首席执行官 James 在最近举行的 ISSCC 2022 虚拟活动的演讲中问道。 “我们知道,因为底层软件方法发生了变化,工具也发生了变化,我们构建软件的方式、软件的分发方式以及通过云使用软件的方式与服务器计算时代有着根本的不同。计算新阶段的标志之一是您可以使用可用的技术来构建新的操作环境。这正是我们今天在云中所做的事情。业界正在采用 X86 架构和 40 多年前开创的 PC 架构构建方法,并将其应用于云计算和现代数据中心。”


她说,这已经不再是问题了。使用相同的架构(在本例中为英特尔和 AMD 使用的架构)将在功耗和数据中心空间方面产生更多问题。半导体行业需要推出可持续产品来减少碳足迹。 James指出云数据中心市场的预期增长。 Synergy Research Group表示,2021年全球企业在云基础设施服务上的支出达到1780亿美元,同比增长37%。

“如果数据中心提供商继续部署遗留解决方案,其消耗的电力和空间将比现在多出两倍,”她说。 “另一方面,如果他们使用像 Ampere 设计的那样的云原生解决方案,他们就可以提供类似的性能,甚至更好的性能,而功耗和占用空间却只占一小部分。”

AmpereComputing 是寻求利用 Arm 架构实现超大规模、HPC 和基于云的数据中心的众多供应商之一,正如我们所报道的,自 AmpereComputing 成立以来,此类公司一直是 AmpereComputing 的目标。亚马逊网络服务等一些公司正在推出自己的芯片(亚马逊的例子是 Graviton 系列),而英伟达也在寻求扩大其产品组合,特别是在其以 400 亿美元收购 Arm 的不幸收购失败之后。但在将 Arm 引入数据中心的努力中,还没有人成为俱乐部的领导者。它仍然是供应商的混搭。

还有不断扩大的加速器世界,从 GPU 到 FPGA,以及工作负载优化的硅片,如数据处理单元 (DPU)。与此同时,经过几年的挫折,英特尔正在寻求重新确立自己作为顶级芯片制造商的地位,这些芯片包括 GPU(从 Ponte Vecchio 开始)和其他芯片。

因此,这将是一个活跃且竞争激烈的半导体市场。在 ISSCC 上,詹姆斯和其他几位安培计算官员谈到了处理器架构需要随着企业需求而改变,这给芯片设计方式的改变带来了压力。

Ampere Computer 首席产品官 Jeff Wittich 表示,组织正在转向云,因为服务可以跨庞大的硬件基础设施无缝部署。开发人员正在使用微服务来更快地构建更多创新应用程序,并更轻松地扩展各个组件,这对于打车等行业的公司来说非常重要,在这些行业中,可以扩展数千个微服务以提供从匹配乘客和司机到绘制乘车地图等一切服务来计费。


人工智能和机器学习进一步改善了此类服务,并且大部分推理都是在边缘完成的,以降低延迟。随着自动驾驶汽车等技术的发挥作用,高性能和低延迟将继续发挥重要作用。

“随着云基础设施变得更加分散,为了满足关键的低延迟要求,集中度越来越低,拥有一款节能处理器是首要要求,它能够适应边缘更受限制的功率和热量范围,同时仍能提供高计算性能,”Wittich 说。“底层硬件必须能够实现云服务提供商和云原生开发人员所需的弹性、弹性、自动化和可移植性。为此,您需要正确类型的 CPU,能够提供可预测的高性能。”

这使得云能够始终提供必要的性能,而不会降低服务平台的可扩展性,并且可以扩展到空间更加受限的边缘。

Ampere Computing 首席技术官 Atiq Bajwa 表示,这带来了一些关键的架构要求,这些要求与云计算出现之前的几十年通常需要的架构要求不同。传统上,重点是往往由大型单片软件应用程序组成的工作负载的峰值性能,而密度是一个关键考虑因素。

然而,Bajwa 表示,原子级架构的发展减缓了性能、密度和功耗方面的节奏和一代又一代的改进,并补充说工艺设计规则更加复杂。

“为了满足当今云数据中心的性能和功能需求,我们越来越需要将多个硅片组装在一个封装中,”他说。 “在多个独立且可能相互干扰的工作负载全部运行在一台服务器上的情况下,性能和一致的性能。电源效率是第一篇文章,不仅因为它对性能和总拥有成本的影响,还因为它对可持续性的影响。最后,软件环境也大不相同,工作负载越来越多地由软件包集合和部署在[虚拟机]或具有多租户规范的容器中的一系列微服务组成。一切都发生了变化,构建云原生产品意味着什么?”

对于安培计算来说,这意味着在他们构建的内容和构建方式上都采取全新的方法。该架构需要提供专用硬件来实现性能、一致性和安全隔离,频率必须一致,性能和一致性意味着高速缓存层次结构和内存子系统具有高且一致的带宽,可以在大规模和高负载下为 CPU 内核供电。

新芯片需要大规模集成、大批量制造和更高的带宽。

随着复杂性的增加,验证和仿真成为确保高质量设计的关键部分,”芯片工程高级副总裁 Mitrajit Chatterjee 说道。 “所有这些设计必须更快、无缝地融合,以满足云软件设计的常规和快速节奏。”

AmpereComputing 工程副总裁 Yesh Kolla 指出,为了跟上计算密度需求,该公司使用在封装级别集成的更小的分解芯片。

Kolla 表示:“通过分解为小芯片,我们可以通过增加芯片小芯片的数量来继续增加整体芯片级晶体管数量,同时可以优化各个芯片区域的产量和可制造性。” “分解确实将整合挑战推向了其他领域。先进的封装技术必须适应高效集成多个芯片。芯片间链路延迟和带宽必须继续改善,同时还要提高信号密度并降低功耗。制造、测试、验证和固件已经发展到可以管理一个包中的多种染料。”

他说,安培计算还通过选择最小化通信和路由的设计、有效地查找逻辑层次结构、通过设计分区以及使用选择性和高度定制的电路来加速关键路径等技术来提高性能。它还与供应商的代工合作伙伴台积电合作开展工作,以帮助降低芯片的功耗和占地面积,并开发先进的电源管理功能和创新的 I/O 设计。

查特吉表示,该公司还希望每年保持稳定的新芯片推出节奏。

“设计融合和产品设计周期是一切结合在一起的地方,”他说。 “为了满足服务器需求,云服务器半导体正在快速执行。在 Ampere,我们的基础设施现在旨在支持多个设计阶段重叠,通过规划芯片成功和开发所有系统附属品来缩短周期时间。对于投片后的成功,关键在于 IP 验证、仿真、固件和平台准备度发挥关键作用。”

本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/74.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论