【工具分享】Nvidia 免费 API 注册与使用指南

7 min

最后更新:2026-04-27

一、概述

NVIDIA 官方平台 build.nvidia.com 提供了大量 Free Endpoint(免费端点) 模型,注册账号并验证手机号后即可生成 API Key,免费调用 80+ 个前沿大模型,无需信用卡,不计 Token 费用。

  • 算力来源:NVIDIA 自家 H100 集群,响应速度快
  • API 兼容性:OpenAI Compatible(兼容 OpenAI SDK)
  • Base URLhttps://integrate.api.nvidia.com/v1/

二、注册流程(3 分钟完成)

第 1 步:注册 NVIDIA 账号

  1. 打开官网 👉 https://build.nvidia.com
  2. 点击右上角 Login
  3. 选择 Create Account 注册新账号
  4. 支持以下登录方式:
    • 微信 / QQ / Apple / Microsoft 一键登录
    • 邮箱注册(推荐 QQ / Outlook 邮箱)
  5. 去邮箱点击激活链接完成注册

第 2 步:验证手机号,解锁 API 权限

  1. 登录后,页面顶部会出现提示:Verify your account to unlock API access
  2. 点击 Verify,输入手机号(支持 +86 国内手机号)
  3. 接收短信验证码并提交
  4. ✅ 验证完成,API 调用权限已解锁

第 3 步:创建 API Key

  1. 点击右上角 头像 → 下拉菜单选 API Keys
  2. 点击右上角 + Generate API Key
  3. 在弹出的对话框中填写:
    • Key Name:自定义名称(如 my-free-key
    • Expiration:选择最长 12 months(1 年)
  4. 点击 Generate Key
  5. ⚠️ 重要:Key 只显示一次!立即复制保存(以 nvapi- 开头的字符串),关闭弹窗后无法再查看

三、使用方法

3.1 API 基本信息

项目
API ProviderOpenAI Compatible
Base URLhttps://integrate.api.nvidia.com/v1/
API Key你申请的 nvapi-xxx Key
模型列表https://integrate.api.nvidia.com/v1/models

3.2 Python 调用示例(使用 OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    base_url="https://integrate.api.nvidia.com/v1",
    api_key="nvapi-你的API密钥"
)

response = client.chat.completions.create(
    model="deepseek-ai/deepseek-r1",  # 替换为你要用的模型 ID
    messages=[
        {"role": "user", "content": "你好,请介绍一下你自己"}
    ],
    temperature=0.6,
    max_tokens=1024
)

print(response.choices[0].message.content)

3.3 cURL 调用示例

curl -X POST "https://integrate.api.nvidia.com/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer nvapi-你的API密钥" \
  -d '{
    "model": "meta/llama-3.3-70b-instruct",
    "messages": [
      {"role": "user", "content": "Hello!"}
    ],
    "temperature": 0.6,
    "max_tokens": 1024
  }'

3.4 Node.js 调用示例

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://integrate.api.nvidia.com/v1",
  apiKey: "nvapi-你的API密钥",
});

const response = await client.chat.completions.create({
  model: "qwen/qwen2.5-7b-instruct",
  messages: [{ role: "user", content: "你好" }],
  temperature: 0.6,
  max_tokens: 1024,
});

console.log(response.choices[0].message.content);

四、免费额度与限制

限制项说明
Token 计费不计费,无余额限制
调用次数无上限
速率限制最多 40 次/分钟(约每 1.5 秒一次请求)
API Key 有效期最长 12 个月
信用卡不需要
数据隐私⚠️ 平台会记录输入输出用于产品改进,不要上传敏感数据

对于个人学习、日常开发、搭建 Agent、跑评测,这个额度完全够用。


五、可用模型列表

5.1 查看所有模型

访问以下 URL 可查看 API 支持的所有模型列表:

GET https://integrate.api.nvidia.com/v1/models

返回格式为 OpenAI 兼容的 JSON,包含 idobjectcreatedowned_by 字段。

5.2 热门免费模型(Free Endpoint)

以下为部分热门免费模型,完整列表可在 build.nvidia.com/models 筛选 “Free Endpoint” 查看。

🔥 大语言模型(LLM)

模型 ID提供商说明
deepseek-ai/deepseek-r1DeepSeek AIDeepSeek R1 推理模型
deepseek-ai/deepseek-v4-flashDeepSeek AI284B MoE,1M 上下文,快速编码
deepseek-ai/deepseek-v4-proDeepSeek AI1M 上下文窗口,编码优化
meta/llama-3.3-70b-instructMetaLlama 3.3 70B 指令微调
meta/llama-3.1-405b-instructMetaLlama 3.1 405B 旗舰模型
meta/llama-4-maverick-17b-128e-instructMetaLlama 4 Maverick MoE
meta/llama-4-scout-17b-16e-instructMetaLlama 4 Scout MoE
mistralai/mistral-large-2-instructMistral AIMistral Large 2
mistralai/mixtral-8x22b-instruct-v0.1Mistral AIMixtral 8x22B MoE
qwen/qwen2.5-7b-instructQwenQwen 2.5 7B
qwen/qwq-32bQwenQwQ 32B 推理模型
minimaxai/minimax-m2.7MiniMax230B 参数,编码/推理/办公
z-ai/glm-4.7Z.aiGLM-4.7 多语言智能体
nvidia/llama-3.1-nemotron-ultra-253b-v1NVIDIANemotron Ultra 253B
nvidia/nemotron-4-340b-instructNVIDIANemotron 4 340B
nvidia/llama-3.3-nemotron-super-49b-v1NVIDIANemotron Super 49B
google/gemma-3-27b-itGoogleGemma 3 27B
microsoft/phi-4-mini-instructMicrosoftPhi-4 Mini
microsoft/phi-4-multimodal-instructMicrosoftPhi-4 多模态
ibm/granite-3.0-8b-instructIBMGranite 3.0 8B

🖼️ 多模态 / 视觉模型

模型 ID提供商说明
meta/llama-3.2-90b-vision-instructMetaLlama 3.2 90B 视觉
meta/llama-3.2-11b-vision-instructMetaLlama 3.2 11B 视觉
microsoft/phi-3.5-vision-instructMicrosoftPhi-3.5 视觉
nvidia/vilaNVIDIAVILA 视觉语言模型
nvidia/neva-22bNVIDIANeVA 22B 视觉模型
adept/fuyu-8bAdeptFuyu-8B 多模态

💻 代码模型

模型 ID提供商说明
deepseek-ai/deepseek-coder-6.7b-instructDeepSeek AIDeepSeek Coder 6.7B
qwen/qwen2.5-coder-32b-instructQwenQwen 2.5 Coder 32B
mistralai/codestral-22b-instruct-v0.1Mistral AICodestral 22B
bigcode/starcoder2-15bBigCodeStarCoder2 15B
google/codegemma-7bGoogleCodeGemma 7B

🔍 嵌入 / 检索模型

模型 ID提供商说明
baai/bge-m3BAAIBGE-M3 多功能嵌入
nvidia/nv-embed-v1NVIDIANV-Embed V1
nvidia/nv-embedqa-e5-v5NVIDIANV-EmbedQA E5 V5
snowflake/arctic-embed-lSnowflakeArctic Embed L

🛡️ 安全 / 护栏模型

模型 ID提供商说明
nvidia/llama-3.1-nemoguard-8b-content-safetyNVIDIA内容安全检测
nvidia/llama-3.1-nemoguard-8b-topic-controlNVIDIA主题控制
nvidia/nemotron-3-content-safetyNVIDIA多语言多模态内容安全
google/shieldgemma-9bGoogleShieldGemma 9B

5.3 API 返回的完整模型列表

通过 GET https://integrate.api.nvidia.com/v1/models 获取到的所有模型 ID(共 130+ 个):

01-ai/yi-large
abacusai/dracarys-llama-3.1-70b-instruct
adept/fuyu-8b
ai21labs/jamba-1.5-large-instruct
ai21labs/jamba-1.5-mini-instruct
aisingapore/sea-lion-7b-instruct
baai/bge-m3
baichuan-inc/baichuan2-13b-chat
bigcode/starcoder2-15b
bigcode/starcoder2-7b
databricks/dbrx-instruct
deepseek-ai/deepseek-coder-6.7b-instruct
deepseek-ai/deepseek-r1
deepseek-ai/deepseek-r1-distill-llama-8b
deepseek-ai/deepseek-r1-distill-qwen-14b
deepseek-ai/deepseek-r1-distill-qwen-32b
deepseek-ai/deepseek-r1-distill-qwen-7b
google/codegemma-1.1-7b
google/codegemma-7b
google/deplot
google/gemma-2-27b-it
google/gemma-2-2b-it
google/gemma-2-9b-it
google/gemma-2b
google/gemma-3-12b-it
google/gemma-3-1b-it
google/gemma-3-27b-it
google/gemma-3-4b-it
google/gemma-7b
google/paligemma
google/recurrentgemma-2b
google/shieldgemma-9b
ibm/granite-3.0-3b-a800m-instruct
ibm/granite-3.0-8b-instruct
ibm/granite-34b-code-instruct
ibm/granite-8b-code-instruct
ibm/granite-guardian-3.0-8b
igenius/colosseum_355b_instruct_16k
igenius/italia_10b_instruct_16k
institute-of-science-tokyo/llama-3.1-swallow-70b-instruct-v0.1
institute-of-science-tokyo/llama-3.1-swallow-8b-instruct-v0.1
mediatek/breeze-7b-instruct
meta/codellama-70b
meta/llama-3.1-405b-instruct
meta/llama-3.1-70b-instruct
meta/llama-3.1-8b-instruct
meta/llama-3.2-11b-vision-instruct
meta/llama-3.2-1b-instruct
meta/llama-3.2-3b-instruct
meta/llama-3.2-90b-vision-instruct
meta/llama-3.3-70b-instruct
meta/llama-4-maverick-17b-128e-instruct
meta/llama-4-scout-17b-16e-instruct
meta/llama2-70b
meta/llama3-70b-instruct
meta/llama3-8b-instruct
microsoft/kosmos-2
microsoft/phi-3-medium-128k-instruct
microsoft/phi-3-medium-4k-instruct
microsoft/phi-3-mini-128k-instruct
microsoft/phi-3-mini-4k-instruct
microsoft/phi-3-small-128k-instruct
microsoft/phi-3-small-8k-instruct
microsoft/phi-3-vision-128k-instruct
microsoft/phi-3.5-mini-instruct
microsoft/phi-3.5-moe-instruct
microsoft/phi-3.5-vision-instruct
microsoft/phi-4-mini-instruct
microsoft/phi-4-multimodal-instruct
mistralai/codestral-22b-instruct-v0.1
mistralai/mamba-codestral-7b-v0.1
mistralai/mathstral-7b-v0.1
mistralai/mistral-7b-instruct-v0.2
mistralai/mistral-7b-instruct-v0.3
mistralai/mistral-large
mistralai/mistral-large-2-instruct
mistralai/mistral-medium-3-instruct
mistralai/mistral-small-24b-instruct
mistralai/mistral-small-3.1-24b-instruct-2503
mistralai/mixtral-8x22b-instruct-v0.1
mistralai/mixtral-8x22b-v0.1
mistralai/mixtral-8x7b-instruct-v0.1
nv-mistralai/mistral-nemo-12b-instruct
nvidia/embed-qa-4
nvidia/llama-3.1-nemoguard-8b-content-safety
nvidia/llama-3.1-nemoguard-8b-topic-control
nvidia/llama-3.1-nemotron-51b-instruct
nvidia/llama-3.1-nemotron-70b-instruct
nvidia/llama-3.1-nemotron-70b-reward
nvidia/llama-3.1-nemotron-nano-8b-v1
nvidia/llama-3.1-nemotron-ultra-253b-v1
nvidia/llama-3.2-nv-embedqa-1b-v1
nvidia/llama-3.2-nv-embedqa-1b-v2
nvidia/llama-3.3-nemotron-super-49b-v1
nvidia/llama3-chatqa-1.5-70b
nvidia/llama3-chatqa-1.5-8b
nvidia/mistral-nemo-minitron-8b-8k-instruct
nvidia/mistral-nemo-minitron-8b-base
nvidia/nemoretriever-parse
nvidia/nemotron-4-340b-instruct
nvidia/nemotron-4-340b-reward
nvidia/nemotron-4-mini-hindi-4b-instruct
nvidia/nemotron-mini-4b-instruct
nvidia/neva-22b
nvidia/nv-embed-v1
nvidia/nv-embedcode-7b-v1
nvidia/nv-embedqa-e5-v5
nvidia/nv-embedqa-mistral-7b-v2
nvidia/nvclip
nvidia/usdcode-llama-3.1-70b-instruct
nvidia/vila
nvquery/meta/llama-3.3-70b-instruct
qwen/qwen2-7b-instruct
qwen/qwen2.5-7b-instruct
qwen/qwen2.5-coder-32b-instruct
qwen/qwen2.5-coder-7b-instruct
qwen/qwq-32b
rakuten/rakutenai-7b-chat
rakuten/rakutenai-7b-instruct
snowflake/arctic-embed-l
thudm/chatglm3-6b
tiiuae/falcon3-7b-instruct
tokyotech-llm/llama-3-swallow-70b-instruct-v0.1
upstage/solar-10.7b-instruct
writer/palmyra-creative-122b
writer/palmyra-fin-70b-32k
writer/palmyra-med-70b
writer/palmyra-med-70b-32k
yentinglin/llama-3-taiwan-70b-instruct
zyphra/zamba2-7b-instruct

注意:API 端点返回的模型列表与 build.nvidia.com 网页上的模型列表可能不完全一致。网页端有更多新模型(如 deepseek-v4-flashminimax-m2.7glm-4.7 等),建议以网页端为准。


六、适用场景

角色推荐理由
独立开发者做 Agent、Coding Copilot,省下 API 费用
学生 / AI 自学者免费 RAG / 微调评估 / 多模型对比实验
产品经理一把 Key 横评 DeepSeek、Kimi、MiniMax、GLM
模型爱好者第一时间免费试用最新发布的前沿模型

七、注意事项

  1. API Key 安全:切勿将 Key 提交到 Git 仓库,建议使用环境变量管理
  2. 数据隐私:平台会记录输入输出用于产品改进,不要上传敏感数据或个人隐私
  3. 免费政策可能调整:建议尽早注册获取 Key,锁定 12 个月有效期
  4. 速率限制:40 次/分钟,不适合高并发生产环境
  5. 仅限非商业用途:部分模型标注 “Non-Commercial Use Only”,商用需购买订阅

八、相关链接