NIM模型使用指引_人工智能平台 PAI(PAI)-阿里云帮助中心

阿里云人工智能平台PAI是NVIDIA授权的中国NIM合作伙伴。

NIM是英伟达推出的一套易于使用的预构建容器工具，目的是帮助企业客户在云、数据中心和工作站上安全、可靠的部署高性能的Al模型推理。NIM模型是通过NIM优化工具加工的性能优化后模型，相比原始开源模型有显著的推理性能提升。

在PAI-Model Gallery中提供了多个NIM模型（可通过在模型广场的左侧筛选栏选择“模型来源”为“NIM”来获取），支持2种使用方式：

支持的NIM模型列表

当前在人工智能平台PAI-Model Gallery中可直接部署的NIM模型如下：

模型名称	Model Gallery模型页面	NIM推理优化支持的机型
qwen2.5-7b-instruct-NIM	qwen2.5-7b-instruct-NIM	ecs.gn7e系列 ecs.gn8is系列
MolMIM	MolMIM	通用GPU机型
Earth-2 FourCastNet	FourCastNet	通用GPU机型
NVIDIA Retrieval QA Mistral 7B Embedding v2	NV-EmbedQA-Mistral-7b-v2	ecs.gn7e系列
Eye Contact	eyecontact	通用GPU机型
NV-CLIP	nvclip	ecs.gn7e系列 ecs.gn7i系列
AlphaFold2-Multimer	AlphaFold2-Multimer	通用GPU机型
Snowflake Arctic Embed Large Embedding	Arctic-embed-l	ecs.gn7e系列 ecs.gn7i系列
NVIDIA Retrieval QA Mistral 4B Reranking v3	NV-RerankQA-Mistral-4B-v3	ecs.gn7e系列 ecs.gn7i系列
NVIDIA Retrieval QA E5 Embedding v5	NV-EmbedQA-E5-v5	ecs.gn7e系列 ecs.gn7i系列
Parakeet CTC Riva 1.1b	Parakeet-CTC-1.1b-asr	通用GPU机型
FastPitch HifiGAN Riva	FastPitchHifi-GAN	通用GPU机型
VISTA-3D	Vista-3D	通用GPU机型
AlphaFold2	AlphaFold2	通用GPU机型
ProteinMPNN	ProteinMPNN	通用GPU机型
megatron-1b-nmt	megatron-1b-nmt	通用GPU机型

进入PAI Model Gallery。
在模型广场的左侧筛选栏选择“模型来源”为“NIM”，找到NIM模型
选择NIM模型进入模型详情页，点击右上角部署按钮即可进入部署页面。请注意，在PAI中部署NIM模型需要您已经是 NVIDIA AI Enterprise 用户或 NVIDIA Developer Program 用户。
配置运行资源等信息后，点击部署按钮即可拉起NIM模型在线服务。调用方式请参考模型介绍。

NIM模型允许用户下载镜像和模型，在本地部署使用。（需要您已经是 NVIDIA AI Enterprise 用户或 NVIDIA Developer Program 用户）

对于未注册/未登录阿里云的用户，首次使用PAI-Model Gallery可参考以下流程：

访问阿里云，单击右上角登录，输入账号和密码进行登录（或注册新用户）。
登录成功并且实名认证后，访问人工智能平台PAI。
如果您是首次使用PAI平台，需要先完成实名认证以及授权，所有选项保持默认，确认后等待十几秒钟即可完成创建，即可前往默认工作空间进行部署使用。