亚马逊云科技特别推出《上新了!亚麻云》,每月与您相约,一文快速了解重磅产品动态!
01「重磅上新」
亚马逊云科技本月重磅新品聚焦高性能算力,不仅上线了基于NVIDIA H200及L40S构建的两款最新GPU实例,同时也带来全新发布的高性能计算托管服务Amazon Parallel Computing Service,全力加速生成式AI及高性能计算。
基于H200的Amazon EC2 P5e
实例及基于L40s的
Amazon EC2 G6e实例正式发布
亚马逊云科技推出全新的Amazon EC2 G6e实例,由NVIDIA L40S Tensor Core GPU提供加速支持。相比上一代G5实例,Amazon EC2 G6e实例的计算性能可提升高达2.5倍,而与P4d实例相比,推理成本则可降低20%左右。
Amazon EC2 G6e实例旨在服务于机器学习和空间计算等GPU密集型工作负载。它能够支持部署大型语言模型(参数量高达130亿)、生成式AI模型(图像/视频/音频扩散模型)以及创建大规模3D模拟和数字孪生体等应用场景。
Amazon EC2 G6e实例目前在美国东部(弗吉尼亚北部、俄亥俄州)和美国西部(俄勒冈州)三个区域开放,提供按需、预留、竞价实例以及节省计划等多种购买模式。开发者可通过亚马逊云科技管理控制台、Amazon CLI和Amazon SDK等渠道启动使用。
亚马逊云科技正式推出全新Amazon EC2 P5e实例,由NVIDIA H200 Tensor Core GPU提供加速支持。相较上代P5实例,Amazon EC2 P5e实例的GPU显存容量提升1.7倍,内存带宽提升1.5倍。
Amazon EC2 P5e实例专为大型语言模型(LLM)、生成式AI模型以及高性能计算(HPC)等GPU密集型工作负载而设计。在LLM推理方面,Amazon EC2 P5e实例可实现显著性能提升和成本节省。
例如,在单个Amazon EC2 P5e实例上部署4050亿参数的Meta LLaMa 3.1模型,吞吐量可比双P5实例提高1.72倍,成本降低69%。此外,Amazon EC2 P5e实例适用于模拟、药物发现、天气预报等内存密集型HPC应用。亚马逊云科技还预告将推出Amazon EC2 P5en实例,采用PCIe Gen5连接CPU和GPU,网络延迟更低。
Amazon EC2 P5e实例现已在美国俄亥俄州区域通过Amazon EC2 Capacity Blocks for Machine Learning开放使用。总的来说,Amazon EC2 P5e是亚马逊云科技面向人工智能和机器学习及HPC工作负载推出的新一代GPU加速实例。
开启HPC云端新时代,亚马逊云科技
推出Amazon Parallel Computing Service
为解决传统HPC集群建设和运维成本高昂且缺乏弹性扩展能力的痛点,亚马逊云科技推出了全新Amazon Parallel Computing Service(Amazon PCS)。这是一项全托管服务,可以使您基于亚马逊云科技轻松运行和扩展高性能计算(HPC)工作负载。
Amazon PCS为用户构建并管理整个Slurm集群环境,包括控制节点、计算节点、作业队列、远程可视化等。Slurm作业调度系统是HPC领域事实上的标准,现被全球众多科研机构和企业广泛使用,它提供强大的作业调度、监控和资源管理功能,支持在大规模节点上高效展开并行作业。Amazon PCS使用户可以在熟悉的Slurm环境中工作,而无需操心底层基础设施。
同时,借助亚马逊云科技的弹性云资源,Amazon PCS根据需求无缝扩展HPC集群的计算规模,支持从零扩展至数千个实例,以高性价比的方式满足各种大规模计算需求。Amazon PCS也支持构建一体化的HPC集群,可与Amazon EFS、Amazon FSx、Amazon EC2等亚马逊云科技核心服务深度集成,让用户可以无缝接入高性能云存储、GPU加速实例等资源,构建更强大的HPC环境。
Amazon PCS为广泛的计算密集型或数据密集型工程和科学工作负载而设计,涉及计算流体动力学、天气模拟、有限元分析、电子设计自动化等领域。目前,Amazon PCS已帮助全球多家科研机构高效运行HPC负载。
Marvel Fusion是一家总部位于德国的聚变能源初创公司,致力于创造无限零排放能源。Marvel Fusion的首席执行官莫里茨·冯德林登说:“我们很高兴Amazon PCS服务将提供高可用性和易于升级的HPC集群管理能力。它将使我们的科学家和IT员工能够在几小时内利用PCS的最新功能,而不是之前需要的数周计划和额外开销。”
02「更多新品」
Amazon Bedrock支持跨区域推理
Amazon Bedrock现已支持跨区域推理,这一新功能可在不同亚马逊云科技区域间动态分配计算资源,应对突发流量高峰。
开启该功能后,按需付费模式的客户可获得高达2倍的区域配额上限,并在高峰期获得更出色的服务可用性和性能表现。客户可选择数据流向的区域范围,满足数据驻留和合规要求,请求会优先分配至最近区域以降低延迟。跨区域推理无需额外路由费用,计费遵循请求发出区域标准。该功能可显著提升应用的可靠性、性能和效率。
Amazon OpenSearch Service
支持Amazon Graviton3实例部署
(中国区域新品)
Amazon OpenSearch Service新增支持基于Amazon Graviton3处理器的实例类型,包括计算优化C7g、通用M7g和内存优化R7g实例。
与上一代Graviton2相比,Graviton3实例性能提升高达25%,提供高达30Gbps的增强网络带宽和20Gbps的Amazon EBS带宽。新实例类型支持所有OpenSearch版本及Elasticsearch 7.9和7.10开源版本。用户可通过Amazon OpenSearch Service控制台或API无缝将域名升级到新的Graviton3实例类型。
Amazon Backup新增
SAP HANA on Amazon EC2的跨区域、
跨账户备份复制功能
Amazon Bedrock现已支持跨区域推理,这一新功能可在不同亚马逊云科技区域间动态分配计算资源,应对突发流量高峰。
通过此功能,客户可以通过Amazon Backup,在亚马逊云科技不同区域和账户中,生成并存储额外的SAP HANA快照副本。这些快照副本为源账户提供了额外的保护,以防意外或恶意删除、灾难或勒索软件导致业务中断。客户可使用亚马逊云科技Backup控制台、API或CLI开始使用SAP HANA的跨区域和跨账户备份,并可按需还原或创建跨区域跨账户副本,降低停机风险,确保满足灾难恢复和业务连续性要求。