单颗物理GPU太贵？阿里云发布云上首个轻量级GPU实例

2022年 11月 27日发表评论

腾讯云正在大促：点击直达阿里云超级红包：点击领取
免费/便宜/高性价比服务器汇总入口(已更新)：点击这里了解

当地时间3月18日，在硅谷举办的年NVIDIA GPU技术大会（GTC）上，阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例，该实例打破了传统直通模式的局限，可以提供比单颗物理GPU更细粒度的服务，从而让客户以更低成本、更高弹性开展业务。

在该实例发布之前，业内均采用以单颗物理GPU为单位的云端异构计算服务。然而，在不少使用异构计算服务的场景中，“计算资源过剩”问题也尤为明显。

以云游戏为例，企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算；人工智能领域也存在类似问题，深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一，甚至更少。对于这类应用场景而言，轻量级计算异构产品可以提升系统灵活性，并大幅降低成本。

而阿里云本次首家提供云上轻量级GPU实例，意味着用户可以用更细粒度的计算资源开启业务。该产品基于NVIDIA Tesla P4 GPU，支持多种规格，企业可以按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工作站，适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。

阿里云表示，5月还将发布基于NVIDIA T4的GPU异构计算产品VGN6i实例，NVIDIA T4采用最新的Turing架构，在虚拟化环境中更为灵活，可加速深度学习和推理工作流程的Tensor Core，以及可加速光线追踪和批量渲染的RT Core。

该产品由阿里云与NVIDIA合作研发，集成了阿里云智能资源调度技术，用户可以按需选择适量的计算资源；同时，还采用了安全隔离技术，实现不同用户之间的强隔离，有效防止信息泄漏；除此之外，QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。

阿里云智能异构计算产品专家张新涛表示，“随着轻量级GPU异构计算产品的推出，阿里云实现了GPU的异构计算场景全覆盖，可以为用户提供从从轻量到高性能计算的服务。”