
据theregister报道,Amazon Web Services 推出了专为高性能计算定制的 CPU、能够处理更多流量的升级版 Nitro 系统,以及可以让两者兼得的网络协议。
该 CPU 称为 Graviton3E,并针对浮点和矢量数学进行了优化——这是高性能计算领域的常见操作。AWS 的公用计算高级副总裁 Peter DeSantis 拒绝详细说明 CPU 的功能,但表示在用于衡量生命科学和金融建模工作负载性能的基准测试中,它的性能优于普通的 Graviton 3。
HPC 工作负载通常涉及并移动大量数据,因此 AWS 创建了弹性结构适配器 (EFA) 以确保数据流动。伴随 EFA 的是可扩展可靠数据报 (SRD)——DeSantis 表示将在 AWS 云中发挥重要作用的 TCP 替代方案。
为了解释原因,他透露 AWS 内部网络依赖于许多自定义交换机和多路径路由。但大多数应用程序和网络使用的 TCP 更喜欢使用单一路径——即使该路径有一个影响性能的慢速节点。
Amazon 自己的 SRD 使用多路径路由并且不按顺序传输数据包,但可以在数据包乱序到达时进行整理。DeSantis 声称它将“以微秒而不是毫秒”重新传输丢弃的数据包,并加速托管在 AWS 云上的网络。
DeSantis 同时表示,这个产品速度也很快,它在亚马逊云中的性能优于 TCP,因为它针对 Nitro 硬件进行了调整,AWS 使用该硬件将网络和存储事务与主机隔离开来。veep 表示,它可以有效地改善数据库写入等情况下的尾部延迟,以至于 Amazon Elastic Block Storage io2 卷将运行 SRD 作为标准,以确保用户获得性能改进。
AWS 还构建了其弹性网络适配器 (ENA) 的新版本——随 EC2 实例提供的网络驱动程序——称为 ENA Express,它提供本机 SRD 支持。
SRD 和 ENA Express 都将工作卸载到 Nitro 卡上。DeSantis 表示,第五代 Nitro 卡的计算能力几乎翻了一番,DRAM 带宽增加了 50%,PCIe 带宽增加了一倍,每秒支持的数据包增加了 60%,延迟减少了 30%。
即将推出的 C7GN 实例类型将 Graviton3 和第五代 Nitro 组合在一起,以提供网络优化的计算选项。Graviton3E 和第五代 Nitro 已在一个名为 HPC7G 的实例中配对,旨在为 HPC 用户提供另一个多云选项。
DeSantis 还详细介绍了针对机器学习需求调整的 EC2 实例类型的工作,然后是对 AWS 的 Lambda 无服务器环境的详细改进。
他解释说,Lambda 是建立在虚拟机上的,因为 AWS 认为它们提供了最合适和最强大的隔离。因此,Lambda 函数在运行时中执行,该运行时存在于占用主机“插槽”的非常小的 VM 中。
AWS 试图让这些 VM 尽可能长时间地运行,因为重新启动 VM(AWS 称之为“冷启动”)需要足够的时间来创建次优的用户体验。
因此,这家云巨头开发了 SnapStart,它解释说这项技术会拍摄功能及其运行时的快照,然后将其缓存。
“当函数被调用并随后扩展时,Lambda SnapStart 会从缓存的快照中恢复新的执行环境,而不是从头开始初始化它们,从而显着改善启动延迟。”
AWS 研究人员发布了一篇解释该技术的论文,该技术已在亚马逊云中免费提供。
此文章转至半导体新闻