NVIDIA NIM

Direct

Optimized inference containers for NVIDIA GPUs. Enterprise-grade performance.

Provider Info

"API Env Var" NVIDIA_API_KEY

"Rate Limits" ~40 RPM

Llama 3.3 70B

Mistral Large

Qwen 3 235B

Gemma 3 12B

Nemotron 3 8B

Free

$0/mo

~40 RPM

All available models · Community support

Standard

$0/mo

Pay-per-use after free tier

All models · Pay-per-token

"Free Tier Available"

~40 RPM, no credit card required — No credit card required

Auto Applied

1000

Free credits on signup

"Claim offer →"