NVIDIA

Enterprise +

company

Verified

https://www.nvidia.com/

nvidia

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

bfshi-nvidia published a model about 8 hours ago

nvidia/VILA-HD-8B-PS3-4K-C-RADIOv2

bfshi-nvidia published a model about 8 hours ago

nvidia/VILA-HD-8B-PS3-1.5K-C-RADIOv2

bfshi-nvidia published a model about 8 hours ago

nvidia/PS3-4K-C-RADIOv2

View all activity

Articles

Llama-NeMoRetriever-ColEmbed: Developer-Focused Guide to NVIDIA's State-of-the-Art Text-Image Retrieval

26 days ago

• 4

Welcome the NVIDIA Llama Nemotron Nano VLM to Hugging Face Hub

Jun 27

• 27

Introducing Cosmos Predict-2: A Foundation For Your Own World Model

Jun 17

• 8

Post-Training Isaac GR00T N1.5 for LeRobot SO-101 Arm

Jun 11

• 74

Supercharge Edge AI with High Accuracy Reasoning Using Llama Nemotron Nano 4B

Jun 10

• 7

Nemotron-Personas: Improve AI Training With the First Synthetic Personas Dataset Aligned to Real-World Distributions

Jun 10

• 14

Explore, Build, and Innovate AI Reasoning with NVIDIA’s Open Models and Recipes

Jun 4

• 21

NVIDIA's GTC 2025 Announcement for Physical AI Developers: New Open Models and Datasets

Mar 18

• 41

Mastering Long Contexts in LLMs with KVPress

Jan 23

• 69

Controlling Language Model Generation with NVIDIA's LogitsProcessorZoo

Dec 23, 2024

• 45

nvidia 's collections 54

Llama Nemotron

Open, Production-ready Enterprise Models

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Text Generation • 50B • Updated 6 days ago • 7.21k • 150
nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-FP8

Text Generation • 50B • Updated 4 days ago • 322 • 9
nvidia/Llama-3_1-Nemotron-Ultra-253B-v1

Text Generation • 253B • Updated 30 days ago • 152k • • 327
nvidia/Llama-3_3-Nemotron-Super-49B-v1

Text Generation • 50B • Updated May 30 • 20.9k • • 319

Cosmos-Predict2

World Foundation Model for Future Prediction

nvidia/Cosmos-Predict2-0.6B-Text2Image

Text-to-Image • Updated Jun 28 • 18
nvidia/Cosmos-Predict2-2B-Text2Image

Text-to-Image • Updated Jun 17 • 792 • 61
nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated 12 days ago • 1.62k • 22
nvidia/Cosmos-Predict2-14B-Text2Image

Text-to-Image • Updated Jun 17 • 490 • 39

Reward Models

Nemotron reward models. For use in RLHF pipelines and LLM-as-a-Judge

nvidia/Llama-3_3-Nemotron-Super-49B-GenRM

Text Generation • 50B • Updated Jun 26 • 216 • 13
nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual

Text Generation • 50B • Updated Jun 26 • 199 • 6
nvidia/Llama-3.3-Nemotron-70B-Reward

Text Generation • 71B • Updated Jun 26 • 59 • 2
nvidia/Llama-3.3-Nemotron-70B-Reward-Multilingual

Text Generation • 71B • Updated Jun 26 • 1.36k • 7

AceReason

Math and Code reasoning model trained through reinforcement learning (RL)

nvidia/AceReason-Nemotron-14B

Text Generation • 15B • Updated Jun 17 • 19.5k • • 85
nvidia/AceReason-Nemotron-7B

Text Generation • 8B • Updated Jun 17 • 3.48k • • 18
nvidia/AceReason-Nemotron-1.1-7B

Text Generation • 8B • Updated 25 days ago • 44.3k • • 55
nvidia/AceReason-Math

Viewer • Updated Jun 18 • 49.6k • 1.85k • 19

Nemotron-H

Mamba-Transformer hybrid models

nvidia/Nemotron-H-47B-Reasoning-128K

Text Generation • 47B • Updated 25 days ago • 540 • 16
nvidia/Nemotron-H-8B-Reasoning-128K

Text Generation • 8B • Updated 25 days ago • 41k • 18
nvidia/Nemotron-H-8B-Reasoning-128K-FP8

Text Generation • 8B • Updated Jun 11 • 54 • 6
nvidia/Nemotron-H-47B-Reasoning-128K-FP8

Text Generation • 47B • Updated Jun 6 • 70 • 5

Describe Anything

Multimodal Large Language Models for Detailed Localized Image and Video Captioning

Running on Zero

334

334

Describe Anything

⚡

Describe masked areas in images
nvidia/DAM-3B

Image-Text-to-Text • Updated May 7 • 5.84k • 125
nvidia/DAM-3B-Video

Image-Text-to-Text • Updated May 7 • 10.2k • 54
nvidia/DAM-3B-Self-Contained

Image-Text-to-Text • Updated May 7 • 12.3k • 22

OpenMathReasoning

Models and datasets from "AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset"

nvidia/OpenMathReasoning

Viewer • Updated May 27 • 5.68M • 12.6k • 318
nvidia/OpenMath-Nemotron-1.5B

Text Generation • 2B • Updated Apr 30 • 4.74k • • 24
nvidia/OpenMath-Nemotron-7B

Text Generation • 8B • Updated Apr 30 • 1.55k • • 9
nvidia/OpenMath-Nemotron-14B

Text Generation • 15B • Updated Apr 30 • 992 • 12

OpenCodeReasoning-II

Reasoning data for supervised finetuning of LLMs to advance code generation and critique

nvidia/OpenCodeReasoning-2

Viewer • Updated May 17 • 2.16M • 2.89k • 34
nvidia/OpenCodeReasoning

Viewer • Updated May 4 • 753k • 3.45k • 489

Scoring Verifiers

Benchmarks for evaluating synthetic verifiers like test case generation and code reward models (as found in https://www.arxiv.org/abs/2502.13820).

nvidia/Scoring-Verifiers

Updated Apr 1 • 32 • 6
Scoring Verifiers: Evaluating Synthetic Verification in Code and Reasoning

Paper • 2502.13820 • Published Feb 19

Cosmos-Reason1

Multimodal world understanding through reasoning

nvidia/Cosmos-Reason1-7B

Image-to-Text • 8B • Updated 4 days ago • 173k • 115
nvidia/Cosmos-Reason1-RL-Dataset

Viewer • Updated May 20 • 892 • 709 • 10
nvidia/Cosmos-Reason1-Benchmark

Viewer • Updated May 20 • 510 • 311 • 5
nvidia/Cosmos-Reason1-SFT-Dataset

Viewer • Updated May 20 • 1.71M • 2.59k • 16

Cosmos-Tokenize1

A suite of image and video tokenizers

nvidia/Cosmos-Tokenize1-CI8x8-360p

Updated Mar 18 • 35 • 2
nvidia/Cosmos-Tokenize1-CI16x16-360p

Updated Mar 18 • 36 • 1
nvidia/Cosmos-Tokenize1-CV4x8x8-360p

Updated Mar 18 • 42 • 1
nvidia/Cosmos-Tokenize1-CV8x8x8-720p

Updated Apr 23 • 3.45k • 2

Cosmos-Tokenizer

A suite of image and video tokenizers

nvidia/Cosmos-0.1-Tokenizer-CI8x8

Updated Nov 11, 2024 • 99 • 31
nvidia/Cosmos-0.1-Tokenizer-CI16x16

Updated Dec 25, 2024 • 106 • 8
nvidia/Cosmos-0.1-Tokenizer-DI8x8

Updated Dec 25, 2024 • 945 • 11
nvidia/Cosmos-0.1-Tokenizer-DI16x16

Updated Dec 25, 2024 • 93 • 9

Physical AI

Collection of commercial-grade datasets for physical AI developers

nvidia/PhysicalAI-SmartSpaces

Updated 21 days ago • 150k • 41
nvidia/PhysicalAI-Robotics-Manipulation-Kitchen

Viewer • Updated May 15 • 405k • 11.2k • 9
nvidia/PhysicalAI-Robotics-GraspGen

Viewer • Updated Jun 21 • 25.5k • 963 • 21
nvidia/PhysicalAI-Robotics-Manipulation-SingleArm

Updated May 15 • 9.59k • 10

Cosmos

The collection of Cosmos models

nvidia/Cosmos-1.0-Guardrail

Updated Jun 11 • 1.55k • 55
nvidia/Cosmos-1.0-Autoregressive-4B

Updated Feb 11 • 25 • 53

AceMath

We are releasing math instruction models, math reward models, general instruction models, all training datasets, and a math reward benchmark.

nvidia/AceMath-1.5B-Instruct

Text Generation • 2B • Updated Jan 17 • 3.07k • 12
nvidia/AceMath-7B-Instruct

Text Generation • 8B • Updated Jan 17 • 1.59k • • 24
nvidia/AceMath-72B-Instruct

Text Generation • 73B • Updated Jan 17 • 1.52k • 19
nvidia/AceMath-7B-RM

Text Generation • 7B • Updated Jan 17 • 12.4k • 6

Eagle 2

Eagle 2 is a family of frontier vision-language models with vision-centric design. The model supports 4K HD input, long-context video, and grounding.

nvidia/Eagle2-1B

Image-Text-to-Text • 1B • Updated Apr 27 • 734 • 24
nvidia/Eagle2-2B

Image-Text-to-Text • 2B • Updated Apr 27 • 627 • 29
nvidia/Eagle2-9B

Image-Text-to-Text • 9B • Updated Jan 28 • 1.06k • 58

Hymba

A series of Hybrid Small Language Models.

nvidia/Hymba-1.5B-Instruct

Text Generation • 2B • Updated Jan 2 • 1.45k • 233
nvidia/Hymba-1.5B-Base

Text Generation • 2B • Updated Jan 2 • 2.64k • 146
Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 46

NVLM 1.0

A family of frontier-class multimodal large language models (LLMs) that achieve state-of-the-art results on vision-language tasks and text-only tasks.

nvidia/NVLM-D-72B

Image-Text-to-Text • 79B • Updated Jan 14 • 52.3k • 772
nvidia/NVLM-D-72B-mcore

Image-Text-to-Text • Updated Jan 14 • 6

Nemotron 4 340B

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models.

nvidia/Nemotron-4-340B-Instruct

Updated Jun 24, 2024 • 25 • 681
nvidia/Nemotron-4-340B-Reward

Updated Jun 19, 2024 • 11 • 125
nvidia/Nemotron-4-340B-Base

Updated Jun 28, 2024 • 13 • 146
nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419

Parakeet

NeMo Parakeet ASR Models attain strong speech recognition accuracy while being efficient for inference. Available in CTC and RNN-Transducer variants.

nvidia/parakeet-rnnt-1.1b

Automatic Speech Recognition • Updated Feb 18 • 14.9k • 151
nvidia/parakeet-ctc-1.1b

Automatic Speech Recognition • 1B • Updated 6 days ago • 2.42k • 32
nvidia/parakeet-rnnt-0.6b

Automatic Speech Recognition • Updated Feb 18 • 427 • 10
nvidia/parakeet-ctc-0.6b

Automatic Speech Recognition • Updated Aug 22, 2024 • 7.53k • 14

InstructRetro

InstructRetro is an autoregressive decoder-only language model (LM) with retrieval-augmented pretraining and instruction tuning.

nvidia/retro-48b-instruct-4k

Text Generation • Updated May 29, 2024 • 19
nvidia/retro-8b-instruct-4k

Text Generation • Updated May 29, 2024 • 14

RLHF

A collection of models trained with Reinforcement Learning from Human Feedback (RLHF).

nvidia/NV-Llama2-70B-RLHF-Chat

Text Generation • Updated Mar 9, 2024 • 4
nvidia/NV-Llama2-13B-RLHF-RM

Text Generation • Updated Mar 9, 2024 • 12 • 3
nvidia/sft_datablend_v1

Viewer • Updated Mar 9, 2024 • 128k • 42 • 13
nvidia/Daring-Anteater

Viewer • Updated Jun 17, 2024 • 99.5k • 1.91k • 25

Llama3-ChatQA-1.5

Llama3-ChatQA-1.5 models excel at conversational question answering (QA) and retrieval-augmented generation (RAG).

nvidia/Llama3-ChatQA-1.5-8B

Text Generation • 8B • Updated May 24, 2024 • 13.3k • 551
nvidia/Llama3-ChatQA-1.5-70B

Text Generation • 71B • Updated May 24, 2024 • 62 • • 333
nvidia/ChatRAG-Bench

Viewer • Updated May 24, 2024 • 34.6k • 1.42k • 111
nvidia/ChatQA-Training-Data

Viewer • Updated Jun 4, 2024 • 442k • 398 • 169

Nemotron 3 8B

The Nemotron 3 8B Family of models is optimized for building production-ready generative AI applications for the enterprise.

nvidia/nemotron-3-8b-base-4k

Text Generation • Updated Feb 9, 2024 • 7 • 88
nvidia/nemotron-3-8b-chat-4k-sft

Text Generation • Updated Feb 9, 2024 • 10
nvidia/nemotron-3-8b-chat-4k-rlhf

Text Generation • Updated Feb 9, 2024 • 12 • 27
nvidia/nemotron-3-8b-chat-4k-steerlm

Text Generation • Updated Feb 9, 2024 • 31 • 22

MambaVision

MambaVision: A Hybrid Mamba-Transformer Vision Backbone. Includes both 1K and 21K pretrained models.

nvidia/MambaVision-L3-512-21K

Image Classification • 0.7B • Updated Mar 29 • 203 • 51
nvidia/MambaVision-L3-256-21K

Image Classification • 0.7B • Updated Mar 29 • 11 • 7
nvidia/MambaVision-L2-512-21K

Image Classification • 0.2B • Updated Mar 29 • 646 • 3
nvidia/MambaVision-L-21K

Image Classification • 0.2B • Updated Mar 29 • 139 • 4

Minitron

A family of compressed models obtained via pruning and knowledge distillation

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • 8B • Updated Aug 22, 2024 • 8.73k • 176
nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • 8B • Updated Oct 9, 2024 • 1.53k • 80
nvidia/Llama-3_1-Nemotron-51B-Instruct

Text Generation • 52B • Updated 30 days ago • 9.37k • 209
nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • 5B • Updated Feb 14 • 3.15k • 191

Llama3-ChatQA-2

This is the collection that presents ChatQA-2, a suite of 128K long-context models, that also have exceptional RAG capabilities

nvidia/Llama3-ChatQA-2-70B

Text Generation • Updated Sep 10, 2024 • 49 • 11
nvidia/Llama3-ChatQA-2-8B

Text Generation • Updated Sep 10, 2024 • 126 • 16
nvidia/ChatQA2-Long-SFT-data

Viewer • Updated Sep 9, 2024 • 117k • 319 • 30

OpenReasoning-Nemotron

Collection of models for OpenReasoning-Nemotron which are trained on 5M reasoning traces for Math, Code and Science.

nvidia/OpenReasoning-Nemotron-1.5B

Text Generation • 2B • Updated 3 days ago • 4.39k • 37
nvidia/OpenReasoning-Nemotron-7B

Text Generation • 8B • Updated 3 days ago • 4.57k • • 40
nvidia/OpenReasoning-Nemotron-14B

Text Generation • 15B • Updated 3 days ago • 799 • 32
nvidia/OpenReasoning-Nemotron-32B

Text Generation • 33B • Updated 3 days ago • 3.66k • • 109

BioNeMo

Accelerated models for digital biology by the NVIDIA BioNeMo team. https://www.nvidia.com/en-us/clara/biopharma/

nvidia/AMPLIFY_350M

0.4B • Updated 15 days ago • 1.79k • 4
nvidia/AMPLIFY_120M

0.1B • Updated 15 days ago • 426 • 4
nvidia/esm2_t6_8M_UR50D

Fill-Mask • 0.0B • Updated 6 days ago • 14
nvidia/esm2_t12_35M_UR50D

Fill-Mask • 0.0B • Updated 6 days ago • 12

GEN3C

3D-Informed World-Consistent Video Generation with Precise Camera Control

nvidia/GEN3C-Cosmos-7B

Updated Jun 18 • 114 • 15
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control

Paper • 2503.03751 • Published Mar 5 • 22
nvidia/GEN3C-Testing-Example

Viewer • Updated Jun 4 • 10 • 361 • 1

Model Optimizer

A collection of generative models quantized and optimized with TensorRT Model Optimizer.

nvidia/DeepSeek-R1-0528-FP4

Text Generation • Updated Jun 9 • 89.2k • 35
nvidia/DeepSeek-R1-FP4

Text Generation • Updated Jun 6 • 23.8k • 262
nvidia/Llama-4-Scout-17B-16E-Instruct-FP4

62B • Updated Apr 14 • 1.43k • 1
nvidia/Llama-3.3-70B-Instruct-FP4

41B • Updated Feb 26 • 13k • 20

Cosmos-Embed1

Joint video-text embedding for physical AI

nvidia/Cosmos-Embed1-224p

1B • Updated Jun 10 • 377 • 3
nvidia/Cosmos-Embed1-336p

1B • Updated Jun 10 • 145
nvidia/Cosmos-Embed1-448p

1B • Updated Jun 10 • 3.32k • 1
Running on CPU Upgrade

Cosmos Embed1

🚀

Cosmos-Embed1 demo app

AceMath-RL

Math reasoning models trained through reinforcement learning (RL)

nvidia/AceMath-RL-Nemotron-7B

Text Generation • 8B • Updated Apr 23 • 2.3k • • 22

OpenCodeReasoning

Reasoning data for supervised finetuning of LLMs to advance data distillation for competitive coding

nvidia/OpenCodeReasoning

Viewer • Updated May 4 • 753k • 3.45k • 489
OpenCodeReasoning: Advancing Data Distillation for Competitive Coding

Paper • 2504.01943 • Published Apr 2 • 16
nvidia/OpenCodeReasoning-Nemotron-7B

Text Generation • 8B • Updated May 7 • 919 • • 37
nvidia/OpenCodeReasoning-Nemotron-14B

Text Generation • 15B • Updated May 7 • 793 • 18

Llama Nemotron Feedback-Edit Inference-Time Scaling

Novel ITS approach for open-ended tasks - No. 1 on Arena Hard on 18 Mar 2025

nvidia/Llama-3.3-Nemotron-70B-Feedback

Text Generation • 71B • Updated Mar 18 • 10 • 7
nvidia/Llama-3.3-Nemotron-70B-Edit

Text Generation • 71B • Updated Mar 18 • 12 • 3
nvidia/Llama-3.3-Nemotron-70B-Select

Text Generation • 71B • Updated Mar 18 • 833 • 9
nvidia/HelpSteer3

Viewer • Updated Jul 2 • 99k • 3.14k • 73

Nemotron-UltraLong

nvidia/Llama-3.1-Nemotron-8B-UltraLong-1M-Instruct

Text Generation • 8B • Updated Apr 17 • 2.45k • 48
nvidia/Llama-3.1-Nemotron-8B-UltraLong-4M-Instruct

Text Generation • 8B • Updated Apr 17 • 49.5k • 117
nvidia/Llama-3.1-Nemotron-8B-UltraLong-2M-Instruct

Text Generation • 8B • Updated Apr 17 • 777 • 15

Cosmos-Transfer1

Multimodal Conditional World Generation for World2World Transfer

nvidia/Cosmos-Transfer1-7B

Updated 24 days ago • 8.11k • 45
nvidia/Cosmos-Transfer1-7B-Sample-AV

Updated Apr 9 • 2.56k • 14
nvidia/Cosmos-Transfer1-7B-Sample-AV-Data-Example

Viewer • Updated Mar 19 • 130 • 144 • 6
nvidia/Cosmos-Transfer1-7B-4KUpscaler

Updated Mar 20 • 234 • 6

Cosmos-Predict1

World Foundation Model for Future Prediction

nvidia/Cosmos-Predict1-4B

Updated Apr 8 • 66 • 1
nvidia/Cosmos-Predict1-5B-Video2World

Updated Apr 8 • 47 • 2
nvidia/Cosmos-Predict1-7B-Text2World

Updated Apr 8 • 351 • 3
nvidia/Cosmos-Predict1-7B-Video2World

Updated Apr 8 • 236 • 2

Llama-3.1-Nemotron-70B

SOTA models on Arena Hard and RewardBench as of 1 Oct 2024.

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13 • 120k • • 2.05k
nvidia/Llama-3.1-Nemotron-70B-Reward-HF

71B • Updated Apr 13 • 1.06k • 88
nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419
HelpSteer2-Preference: Complementing Ratings with Preferences

Paper • 2410.01257 • Published Oct 2, 2024 • 25

QLIP

QLIP is a family of image tokenizers with SOTA reconstruction quality and zero-shot image understanding.

nvidia/QLIP-L-14-392

0.7B • Updated Feb 10 • 38 • 10
nvidia/QLIP-B-8-256

0.2B • Updated Feb 10 • 121 • 7
nvidia/QLIP-B-16-256

0.2B • Updated Feb 10 • 7 • 4

DMC

LLMs equipped with Dynamic Memory Compression to accelerate generation.

nvidia/Llama-2-7B-DMC-4x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-7B-DMC-8x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-13B-DMC-4x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-13B-DMC-8x

Updated Dec 22, 2024 • 2

NemoGuard

Essential datasets and models for content safety, topic-following, and security guardrails

nvidia/Aegis-AI-Content-Safety-Dataset-2.0

Viewer • Updated Jun 9 • 33.4k • 2.49k • 41
nvidia/llama-3.1-nemoguard-8b-topic-control

Text Classification • Updated Jun 9 • 1.28k • 15
nvidia/llama-3.1-nemoguard-8b-content-safety

Text Classification • Updated Jun 9 • 419 • 24
nvidia/CantTalkAboutThis-Topic-Control-Dataset

Viewer • Updated Jan 16 • 1.09k • 107 • 6

NeMo Audio Codecs

A series of Neural Audio Codecs

nvidia/low-frame-rate-speech-codec-22khz

Updated Dec 12, 2024 • 162 • 17
nvidia/audio-codec-22khz

Updated Dec 6, 2024 • 77 • 5
nvidia/audio-codec-44khz

Updated Dec 6, 2024 • 748 • 17
nvidia/mel-codec-22khz

Updated Dec 7, 2024 • 60 • 3

Optimized ONNX models for NVIDIA RTX GPUs

Collection of optimized ONNX model checkpoints for NVIDIA RTX GPUs

nvidia/Gemma-2b-it-ONNX-INT4

Updated Nov 15, 2024 • 7
nvidia/Meta-Llama-3.1-8B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 28 • 5
nvidia/Meta-Llama-3.2-3B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Mistral-7B-Instruct-v0.3-ONNX-INT4

Updated Nov 15, 2024 • 6

OpenMath-2

A collection of models and datasets introduced in "OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data"

nvidia/OpenMath2-Llama3.1-8B

Text Generation • 8B • Updated Nov 25, 2024 • 1.09k • • 31
nvidia/OpenMath2-Llama3.1-70B

Text Generation • 71B • Updated Nov 25, 2024 • 823 • 20
nvidia/OpenMathInstruct-2

Viewer • Updated Nov 25, 2024 • 22M • 11.9k • 187
nvidia/OpenMath2-Llama3.1-8B-nemo

Updated Nov 25, 2024 • 6

SteerLM

A collection of models and datasets relating to SteerLM and HelpSteer.

nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419
nvidia/Llama3-70B-SteerLM-RM

Updated Jun 19, 2024 • 4 • 43
nvidia/Nemotron-4-340B-Reward

Updated Jun 19, 2024 • 11 • 125
nvidia/HelpSteer

Viewer • Updated Dec 18, 2024 • 37.1k • 1.63k • 237

Canary

A collection of multilingual and multitask speech to text models from NVIDIA NeMo 🐤

nvidia/canary-1b

Automatic Speech Recognition • Updated Apr 24 • 15.7k • 439
nvidia/canary-1b-flash

Automatic Speech Recognition • 0.8B • Updated Jun 26 • 151k • 233
nvidia/canary-180m-flash

Automatic Speech Recognition • Updated Mar 18 • 11.5k • 70
Training and Inference Efficiency of Encoder-Decoder Speech Models

Paper • 2503.05931 • Published Mar 7 • 3

OpenMath

A collection of models and datasets introduced in "OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset"

nvidia/OpenMath-Mistral-7B-v0.1

Updated Feb 16, 2024 • 12
nvidia/OpenMath-Mistral-7B-v0.1-hf

Text Generation • 7B • Updated Feb 16, 2024 • 8 • 32
nvidia/OpenMath-CodeLlama-7b-Python

Updated Feb 16, 2024 • 2
nvidia/OpenMath-CodeLlama-7b-Python-hf

Text Generation • 7B • Updated Feb 16, 2024 • 11 • 7

NV-Embed

NV-Embed is a generalist embedding model encompassing retrieval, reranking, classification, clustering, STS tasks.

nvidia/NV-Embed-v1

8B • Updated Nov 30, 2024 • 2.95k • 427
nvidia/NV-Embed-v2

Feature Extraction • 8B • Updated 15 days ago • 28.2k • 454
nvidia/MM-Embed

8B • Updated Nov 6, 2024 • 741 • 58

SSMs

A collection of Mamba-2-based research models with 8B parameters trained on 3.5T tokens for comparison with Transformers.

nvidia/mamba2-8b-3t-4k

Text Generation • Updated Jun 13, 2024 • 17
nvidia/mamba2-hybrid-8b-3t-128k

Text Generation • Updated Jun 13, 2024 • 43
nvidia/mamba2-hybrid-8b-3t-32k

Text Generation • Updated Jun 13, 2024 • 5
nvidia/mamba2-hybrid-8b-3t-4k

Text Generation • Updated Jun 13, 2024 • 72

BigVGAN

BigVGAN is a universal neural vocoder that generates audio waveform using mel spectrogram as input.

Running

104

104

BigVGAN

🔊

Generate high-fidelity audio from input audio waveforms
nvidia/bigvgan_v2_44khz_128band_512x

Audio-to-Audio • Updated Sep 5, 2024 • 351k • 50
nvidia/bigvgan_v2_44khz_128band_256x

Audio-to-Audio • Updated Sep 5, 2024 • 1.63k • 7
nvidia/bigvgan_v2_24khz_100band_256x

Audio-to-Audio • Updated Sep 5, 2024 • 26.8k • 17

PS3: Scaling Vision Pre-Training to 4K Resolution

Enabling 4k resolution for VLMs, CVPR 2025, https://nvlabs.github.io/PS3/

nvidia/PS3-1.5K-SigLIP2

Image Feature Extraction • 1B • Updated 6 days ago • 49
nvidia/PS3-4K-SigLIP2

Image Feature Extraction • 1B • Updated 6 days ago • 3
nvidia/PS3_Lang-1.5K-SigLIP2

Image Feature Extraction • 0.5B • Updated 6 days ago • 3
nvidia/PS3_Lang-4K-SigLIP2

Image Feature Extraction • 0.6B • Updated 6 days ago • 5

RADIO

A collection of Foundation Vision Models that combine multiple models (CLIP, DINOv2, SAM, etc.).

nvidia/C-RADIOv2-g

Image Feature Extraction • 1B • Updated Apr 17 • 29 • 12
nvidia/C-RADIOv2-H

0.7B • Updated Apr 17 • 2.95k • 6
nvidia/C-RADIOv2-L

0.3B • Updated Apr 17 • 309 • 2
nvidia/C-RADIOv2-B

Image Feature Extraction • 0.1B • Updated Apr 17 • 786 • 9

NeMo Curator - Classifier Models

Classifier models that can be used in NeMo Curator for labelling/filtering datasets.

nvidia/domain-classifier

0.2B • Updated Jan 24 • 7.85k • 86
nvidia/quality-classifier-deberta

0.2B • Updated Jan 31 • 6.5k • 65
HuggingFaceFW/fineweb-edu-classifier

Text Classification • 0.1B • Updated Nov 17, 2024 • 11.2k • • 189
nvidia/Aegis-AI-Content-Safety-LlamaGuard-Defensive-1.0

Text Classification • Updated Jun 9 • 262k • 24

Llama Nemotron

Open, Production-ready Enterprise Models

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Text Generation • 50B • Updated 6 days ago • 7.21k • 150
nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-FP8

Text Generation • 50B • Updated 4 days ago • 322 • 9
nvidia/Llama-3_1-Nemotron-Ultra-253B-v1

Text Generation • 253B • Updated 30 days ago • 152k • • 327
nvidia/Llama-3_3-Nemotron-Super-49B-v1

Text Generation • 50B • Updated May 30 • 20.9k • • 319

OpenReasoning-Nemotron

Collection of models for OpenReasoning-Nemotron which are trained on 5M reasoning traces for Math, Code and Science.

nvidia/OpenReasoning-Nemotron-1.5B

Text Generation • 2B • Updated 3 days ago • 4.39k • 37
nvidia/OpenReasoning-Nemotron-7B

Text Generation • 8B • Updated 3 days ago • 4.57k • • 40
nvidia/OpenReasoning-Nemotron-14B

Text Generation • 15B • Updated 3 days ago • 799 • 32
nvidia/OpenReasoning-Nemotron-32B

Text Generation • 33B • Updated 3 days ago • 3.66k • • 109

Cosmos-Predict2

World Foundation Model for Future Prediction

nvidia/Cosmos-Predict2-0.6B-Text2Image

Text-to-Image • Updated Jun 28 • 18
nvidia/Cosmos-Predict2-2B-Text2Image

Text-to-Image • Updated Jun 17 • 792 • 61
nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated 12 days ago • 1.62k • 22
nvidia/Cosmos-Predict2-14B-Text2Image

Text-to-Image • Updated Jun 17 • 490 • 39

BioNeMo

Accelerated models for digital biology by the NVIDIA BioNeMo team. https://www.nvidia.com/en-us/clara/biopharma/

nvidia/AMPLIFY_350M

0.4B • Updated 15 days ago • 1.79k • 4
nvidia/AMPLIFY_120M

0.1B • Updated 15 days ago • 426 • 4
nvidia/esm2_t6_8M_UR50D

Fill-Mask • 0.0B • Updated 6 days ago • 14
nvidia/esm2_t12_35M_UR50D

Fill-Mask • 0.0B • Updated 6 days ago • 12

Reward Models

Nemotron reward models. For use in RLHF pipelines and LLM-as-a-Judge

nvidia/Llama-3_3-Nemotron-Super-49B-GenRM

Text Generation • 50B • Updated Jun 26 • 216 • 13
nvidia/Llama-3_3-Nemotron-Super-49B-GenRM-Multilingual

Text Generation • 50B • Updated Jun 26 • 199 • 6
nvidia/Llama-3.3-Nemotron-70B-Reward

Text Generation • 71B • Updated Jun 26 • 59 • 2
nvidia/Llama-3.3-Nemotron-70B-Reward-Multilingual

Text Generation • 71B • Updated Jun 26 • 1.36k • 7

GEN3C

3D-Informed World-Consistent Video Generation with Precise Camera Control

nvidia/GEN3C-Cosmos-7B

Updated Jun 18 • 114 • 15
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control

Paper • 2503.03751 • Published Mar 5 • 22
nvidia/GEN3C-Testing-Example

Viewer • Updated Jun 4 • 10 • 361 • 1

AceReason

Math and Code reasoning model trained through reinforcement learning (RL)

nvidia/AceReason-Nemotron-14B

Text Generation • 15B • Updated Jun 17 • 19.5k • • 85
nvidia/AceReason-Nemotron-7B

Text Generation • 8B • Updated Jun 17 • 3.48k • • 18
nvidia/AceReason-Nemotron-1.1-7B

Text Generation • 8B • Updated 25 days ago • 44.3k • • 55
nvidia/AceReason-Math

Viewer • Updated Jun 18 • 49.6k • 1.85k • 19

Model Optimizer

A collection of generative models quantized and optimized with TensorRT Model Optimizer.

nvidia/DeepSeek-R1-0528-FP4

Text Generation • Updated Jun 9 • 89.2k • 35
nvidia/DeepSeek-R1-FP4

Text Generation • Updated Jun 6 • 23.8k • 262
nvidia/Llama-4-Scout-17B-16E-Instruct-FP4

62B • Updated Apr 14 • 1.43k • 1
nvidia/Llama-3.3-70B-Instruct-FP4

41B • Updated Feb 26 • 13k • 20

Nemotron-H

Mamba-Transformer hybrid models

nvidia/Nemotron-H-47B-Reasoning-128K

Text Generation • 47B • Updated 25 days ago • 540 • 16
nvidia/Nemotron-H-8B-Reasoning-128K

Text Generation • 8B • Updated 25 days ago • 41k • 18
nvidia/Nemotron-H-8B-Reasoning-128K-FP8

Text Generation • 8B • Updated Jun 11 • 54 • 6
nvidia/Nemotron-H-47B-Reasoning-128K-FP8

Text Generation • 47B • Updated Jun 6 • 70 • 5

Cosmos-Embed1

Joint video-text embedding for physical AI

nvidia/Cosmos-Embed1-224p

1B • Updated Jun 10 • 377 • 3
nvidia/Cosmos-Embed1-336p

1B • Updated Jun 10 • 145
nvidia/Cosmos-Embed1-448p

1B • Updated Jun 10 • 3.32k • 1
Running on CPU Upgrade

Cosmos Embed1

🚀

Cosmos-Embed1 demo app

Describe Anything

Multimodal Large Language Models for Detailed Localized Image and Video Captioning

Running on Zero

334

334

Describe Anything

⚡

Describe masked areas in images
nvidia/DAM-3B

Image-Text-to-Text • Updated May 7 • 5.84k • 125
nvidia/DAM-3B-Video

Image-Text-to-Text • Updated May 7 • 10.2k • 54
nvidia/DAM-3B-Self-Contained

Image-Text-to-Text • Updated May 7 • 12.3k • 22

AceMath-RL

Math reasoning models trained through reinforcement learning (RL)

nvidia/AceMath-RL-Nemotron-7B

Text Generation • 8B • Updated Apr 23 • 2.3k • • 22

OpenMathReasoning

Models and datasets from "AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset"

nvidia/OpenMathReasoning

Viewer • Updated May 27 • 5.68M • 12.6k • 318
nvidia/OpenMath-Nemotron-1.5B

Text Generation • 2B • Updated Apr 30 • 4.74k • • 24
nvidia/OpenMath-Nemotron-7B

Text Generation • 8B • Updated Apr 30 • 1.55k • • 9
nvidia/OpenMath-Nemotron-14B

Text Generation • 15B • Updated Apr 30 • 992 • 12

OpenCodeReasoning

Reasoning data for supervised finetuning of LLMs to advance data distillation for competitive coding

nvidia/OpenCodeReasoning

Viewer • Updated May 4 • 753k • 3.45k • 489
OpenCodeReasoning: Advancing Data Distillation for Competitive Coding

Paper • 2504.01943 • Published Apr 2 • 16
nvidia/OpenCodeReasoning-Nemotron-7B

Text Generation • 8B • Updated May 7 • 919 • • 37
nvidia/OpenCodeReasoning-Nemotron-14B

Text Generation • 15B • Updated May 7 • 793 • 18

OpenCodeReasoning-II

Reasoning data for supervised finetuning of LLMs to advance code generation and critique

nvidia/OpenCodeReasoning-2

Viewer • Updated May 17 • 2.16M • 2.89k • 34
nvidia/OpenCodeReasoning

Viewer • Updated May 4 • 753k • 3.45k • 489

Llama Nemotron Feedback-Edit Inference-Time Scaling

Novel ITS approach for open-ended tasks - No. 1 on Arena Hard on 18 Mar 2025

nvidia/Llama-3.3-Nemotron-70B-Feedback

Text Generation • 71B • Updated Mar 18 • 10 • 7
nvidia/Llama-3.3-Nemotron-70B-Edit

Text Generation • 71B • Updated Mar 18 • 12 • 3
nvidia/Llama-3.3-Nemotron-70B-Select

Text Generation • 71B • Updated Mar 18 • 833 • 9
nvidia/HelpSteer3

Viewer • Updated Jul 2 • 99k • 3.14k • 73

Scoring Verifiers

Benchmarks for evaluating synthetic verifiers like test case generation and code reward models (as found in https://www.arxiv.org/abs/2502.13820).

nvidia/Scoring-Verifiers

Updated Apr 1 • 32 • 6
Scoring Verifiers: Evaluating Synthetic Verification in Code and Reasoning

Paper • 2502.13820 • Published Feb 19

Nemotron-UltraLong

nvidia/Llama-3.1-Nemotron-8B-UltraLong-1M-Instruct

Text Generation • 8B • Updated Apr 17 • 2.45k • 48
nvidia/Llama-3.1-Nemotron-8B-UltraLong-4M-Instruct

Text Generation • 8B • Updated Apr 17 • 49.5k • 117
nvidia/Llama-3.1-Nemotron-8B-UltraLong-2M-Instruct

Text Generation • 8B • Updated Apr 17 • 777 • 15

Cosmos-Reason1

Multimodal world understanding through reasoning

nvidia/Cosmos-Reason1-7B

Image-to-Text • 8B • Updated 4 days ago • 173k • 115
nvidia/Cosmos-Reason1-RL-Dataset

Viewer • Updated May 20 • 892 • 709 • 10
nvidia/Cosmos-Reason1-Benchmark

Viewer • Updated May 20 • 510 • 311 • 5
nvidia/Cosmos-Reason1-SFT-Dataset

Viewer • Updated May 20 • 1.71M • 2.59k • 16

Cosmos-Transfer1

Multimodal Conditional World Generation for World2World Transfer

nvidia/Cosmos-Transfer1-7B

Updated 24 days ago • 8.11k • 45
nvidia/Cosmos-Transfer1-7B-Sample-AV

Updated Apr 9 • 2.56k • 14
nvidia/Cosmos-Transfer1-7B-Sample-AV-Data-Example

Viewer • Updated Mar 19 • 130 • 144 • 6
nvidia/Cosmos-Transfer1-7B-4KUpscaler

Updated Mar 20 • 234 • 6

Cosmos-Tokenize1

A suite of image and video tokenizers

nvidia/Cosmos-Tokenize1-CI8x8-360p

Updated Mar 18 • 35 • 2
nvidia/Cosmos-Tokenize1-CI16x16-360p

Updated Mar 18 • 36 • 1
nvidia/Cosmos-Tokenize1-CV4x8x8-360p

Updated Mar 18 • 42 • 1
nvidia/Cosmos-Tokenize1-CV8x8x8-720p

Updated Apr 23 • 3.45k • 2

Cosmos-Predict1

World Foundation Model for Future Prediction

nvidia/Cosmos-Predict1-4B

Updated Apr 8 • 66 • 1
nvidia/Cosmos-Predict1-5B-Video2World

Updated Apr 8 • 47 • 2
nvidia/Cosmos-Predict1-7B-Text2World

Updated Apr 8 • 351 • 3
nvidia/Cosmos-Predict1-7B-Video2World

Updated Apr 8 • 236 • 2

Cosmos-Tokenizer

A suite of image and video tokenizers

nvidia/Cosmos-0.1-Tokenizer-CI8x8

Updated Nov 11, 2024 • 99 • 31
nvidia/Cosmos-0.1-Tokenizer-CI16x16

Updated Dec 25, 2024 • 106 • 8
nvidia/Cosmos-0.1-Tokenizer-DI8x8

Updated Dec 25, 2024 • 945 • 11
nvidia/Cosmos-0.1-Tokenizer-DI16x16

Updated Dec 25, 2024 • 93 • 9

Llama-3.1-Nemotron-70B

SOTA models on Arena Hard and RewardBench as of 1 Oct 2024.

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13 • 120k • • 2.05k
nvidia/Llama-3.1-Nemotron-70B-Reward-HF

71B • Updated Apr 13 • 1.06k • 88
nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419
HelpSteer2-Preference: Complementing Ratings with Preferences

Paper • 2410.01257 • Published Oct 2, 2024 • 25

Physical AI

Collection of commercial-grade datasets for physical AI developers

nvidia/PhysicalAI-SmartSpaces

Updated 21 days ago • 150k • 41
nvidia/PhysicalAI-Robotics-Manipulation-Kitchen

Viewer • Updated May 15 • 405k • 11.2k • 9
nvidia/PhysicalAI-Robotics-GraspGen

Viewer • Updated Jun 21 • 25.5k • 963 • 21
nvidia/PhysicalAI-Robotics-Manipulation-SingleArm

Updated May 15 • 9.59k • 10

QLIP

QLIP is a family of image tokenizers with SOTA reconstruction quality and zero-shot image understanding.

nvidia/QLIP-L-14-392

0.7B • Updated Feb 10 • 38 • 10
nvidia/QLIP-B-8-256

0.2B • Updated Feb 10 • 121 • 7
nvidia/QLIP-B-16-256

0.2B • Updated Feb 10 • 7 • 4

Cosmos

The collection of Cosmos models

nvidia/Cosmos-1.0-Guardrail

Updated Jun 11 • 1.55k • 55
nvidia/Cosmos-1.0-Autoregressive-4B

Updated Feb 11 • 25 • 53

DMC

LLMs equipped with Dynamic Memory Compression to accelerate generation.

nvidia/Llama-2-7B-DMC-4x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-7B-DMC-8x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-13B-DMC-4x

Updated Dec 22, 2024 • 1
nvidia/Llama-2-13B-DMC-8x

Updated Dec 22, 2024 • 2

AceMath

We are releasing math instruction models, math reward models, general instruction models, all training datasets, and a math reward benchmark.

nvidia/AceMath-1.5B-Instruct

Text Generation • 2B • Updated Jan 17 • 3.07k • 12
nvidia/AceMath-7B-Instruct

Text Generation • 8B • Updated Jan 17 • 1.59k • • 24
nvidia/AceMath-72B-Instruct

Text Generation • 73B • Updated Jan 17 • 1.52k • 19
nvidia/AceMath-7B-RM

Text Generation • 7B • Updated Jan 17 • 12.4k • 6

NemoGuard

Essential datasets and models for content safety, topic-following, and security guardrails

nvidia/Aegis-AI-Content-Safety-Dataset-2.0

Viewer • Updated Jun 9 • 33.4k • 2.49k • 41
nvidia/llama-3.1-nemoguard-8b-topic-control

Text Classification • Updated Jun 9 • 1.28k • 15
nvidia/llama-3.1-nemoguard-8b-content-safety

Text Classification • Updated Jun 9 • 419 • 24
nvidia/CantTalkAboutThis-Topic-Control-Dataset

Viewer • Updated Jan 16 • 1.09k • 107 • 6

Eagle 2

Eagle 2 is a family of frontier vision-language models with vision-centric design. The model supports 4K HD input, long-context video, and grounding.

nvidia/Eagle2-1B

Image-Text-to-Text • 1B • Updated Apr 27 • 734 • 24
nvidia/Eagle2-2B

Image-Text-to-Text • 2B • Updated Apr 27 • 627 • 29
nvidia/Eagle2-9B

Image-Text-to-Text • 9B • Updated Jan 28 • 1.06k • 58

NeMo Audio Codecs

A series of Neural Audio Codecs

nvidia/low-frame-rate-speech-codec-22khz

Updated Dec 12, 2024 • 162 • 17
nvidia/audio-codec-22khz

Updated Dec 6, 2024 • 77 • 5
nvidia/audio-codec-44khz

Updated Dec 6, 2024 • 748 • 17
nvidia/mel-codec-22khz

Updated Dec 7, 2024 • 60 • 3

Hymba

A series of Hybrid Small Language Models.

nvidia/Hymba-1.5B-Instruct

Text Generation • 2B • Updated Jan 2 • 1.45k • 233
nvidia/Hymba-1.5B-Base

Text Generation • 2B • Updated Jan 2 • 2.64k • 146
Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 46

Optimized ONNX models for NVIDIA RTX GPUs

Collection of optimized ONNX model checkpoints for NVIDIA RTX GPUs

nvidia/Gemma-2b-it-ONNX-INT4

Updated Nov 15, 2024 • 7
nvidia/Meta-Llama-3.1-8B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 28 • 5
nvidia/Meta-Llama-3.2-3B-Instruct-ONNX-INT4

Updated Nov 15, 2024 • 8
nvidia/Mistral-7B-Instruct-v0.3-ONNX-INT4

Updated Nov 15, 2024 • 6

NVLM 1.0

A family of frontier-class multimodal large language models (LLMs) that achieve state-of-the-art results on vision-language tasks and text-only tasks.

nvidia/NVLM-D-72B

Image-Text-to-Text • 79B • Updated Jan 14 • 52.3k • 772
nvidia/NVLM-D-72B-mcore

Image-Text-to-Text • Updated Jan 14 • 6

OpenMath-2

A collection of models and datasets introduced in "OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data"

nvidia/OpenMath2-Llama3.1-8B

Text Generation • 8B • Updated Nov 25, 2024 • 1.09k • • 31
nvidia/OpenMath2-Llama3.1-70B

Text Generation • 71B • Updated Nov 25, 2024 • 823 • 20
nvidia/OpenMathInstruct-2

Viewer • Updated Nov 25, 2024 • 22M • 11.9k • 187
nvidia/OpenMath2-Llama3.1-8B-nemo

Updated Nov 25, 2024 • 6

Nemotron 4 340B

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models.

nvidia/Nemotron-4-340B-Instruct

Updated Jun 24, 2024 • 25 • 681
nvidia/Nemotron-4-340B-Reward

Updated Jun 19, 2024 • 11 • 125
nvidia/Nemotron-4-340B-Base

Updated Jun 28, 2024 • 13 • 146
nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419

SteerLM

A collection of models and datasets relating to SteerLM and HelpSteer.

nvidia/HelpSteer2

Viewer • Updated Dec 18, 2024 • 21.4k • 2.38k • 419
nvidia/Llama3-70B-SteerLM-RM

Updated Jun 19, 2024 • 4 • 43
nvidia/Nemotron-4-340B-Reward

Updated Jun 19, 2024 • 11 • 125
nvidia/HelpSteer

Viewer • Updated Dec 18, 2024 • 37.1k • 1.63k • 237

Parakeet

NeMo Parakeet ASR Models attain strong speech recognition accuracy while being efficient for inference. Available in CTC and RNN-Transducer variants.

nvidia/parakeet-rnnt-1.1b

Automatic Speech Recognition • Updated Feb 18 • 14.9k • 151
nvidia/parakeet-ctc-1.1b

Automatic Speech Recognition • 1B • Updated 6 days ago • 2.42k • 32
nvidia/parakeet-rnnt-0.6b

Automatic Speech Recognition • Updated Feb 18 • 427 • 10
nvidia/parakeet-ctc-0.6b

Automatic Speech Recognition • Updated Aug 22, 2024 • 7.53k • 14

Canary

A collection of multilingual and multitask speech to text models from NVIDIA NeMo 🐤

nvidia/canary-1b

Automatic Speech Recognition • Updated Apr 24 • 15.7k • 439
nvidia/canary-1b-flash

Automatic Speech Recognition • 0.8B • Updated Jun 26 • 151k • 233
nvidia/canary-180m-flash

Automatic Speech Recognition • Updated Mar 18 • 11.5k • 70
Training and Inference Efficiency of Encoder-Decoder Speech Models

Paper • 2503.05931 • Published Mar 7 • 3

InstructRetro

InstructRetro is an autoregressive decoder-only language model (LM) with retrieval-augmented pretraining and instruction tuning.

nvidia/retro-48b-instruct-4k

Text Generation • Updated May 29, 2024 • 19
nvidia/retro-8b-instruct-4k

Text Generation • Updated May 29, 2024 • 14

OpenMath

A collection of models and datasets introduced in "OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset"

nvidia/OpenMath-Mistral-7B-v0.1

Updated Feb 16, 2024 • 12
nvidia/OpenMath-Mistral-7B-v0.1-hf

Text Generation • 7B • Updated Feb 16, 2024 • 8 • 32
nvidia/OpenMath-CodeLlama-7b-Python

Updated Feb 16, 2024 • 2
nvidia/OpenMath-CodeLlama-7b-Python-hf

Text Generation • 7B • Updated Feb 16, 2024 • 11 • 7

RLHF

A collection of models trained with Reinforcement Learning from Human Feedback (RLHF).

nvidia/NV-Llama2-70B-RLHF-Chat

Text Generation • Updated Mar 9, 2024 • 4
nvidia/NV-Llama2-13B-RLHF-RM

Text Generation • Updated Mar 9, 2024 • 12 • 3
nvidia/sft_datablend_v1

Viewer • Updated Mar 9, 2024 • 128k • 42 • 13
nvidia/Daring-Anteater

Viewer • Updated Jun 17, 2024 • 99.5k • 1.91k • 25

NV-Embed

NV-Embed is a generalist embedding model encompassing retrieval, reranking, classification, clustering, STS tasks.

nvidia/NV-Embed-v1

8B • Updated Nov 30, 2024 • 2.95k • 427
nvidia/NV-Embed-v2

Feature Extraction • 8B • Updated 15 days ago • 28.2k • 454
nvidia/MM-Embed

8B • Updated Nov 6, 2024 • 741 • 58

Llama3-ChatQA-1.5

Llama3-ChatQA-1.5 models excel at conversational question answering (QA) and retrieval-augmented generation (RAG).

nvidia/Llama3-ChatQA-1.5-8B

Text Generation • 8B • Updated May 24, 2024 • 13.3k • 551
nvidia/Llama3-ChatQA-1.5-70B

Text Generation • 71B • Updated May 24, 2024 • 62 • • 333
nvidia/ChatRAG-Bench

Viewer • Updated May 24, 2024 • 34.6k • 1.42k • 111
nvidia/ChatQA-Training-Data

Viewer • Updated Jun 4, 2024 • 442k • 398 • 169

SSMs

A collection of Mamba-2-based research models with 8B parameters trained on 3.5T tokens for comparison with Transformers.

nvidia/mamba2-8b-3t-4k

Text Generation • Updated Jun 13, 2024 • 17
nvidia/mamba2-hybrid-8b-3t-128k

Text Generation • Updated Jun 13, 2024 • 43
nvidia/mamba2-hybrid-8b-3t-32k

Text Generation • Updated Jun 13, 2024 • 5
nvidia/mamba2-hybrid-8b-3t-4k

Text Generation • Updated Jun 13, 2024 • 72

Nemotron 3 8B

The Nemotron 3 8B Family of models is optimized for building production-ready generative AI applications for the enterprise.

nvidia/nemotron-3-8b-base-4k

Text Generation • Updated Feb 9, 2024 • 7 • 88
nvidia/nemotron-3-8b-chat-4k-sft

Text Generation • Updated Feb 9, 2024 • 10
nvidia/nemotron-3-8b-chat-4k-rlhf

Text Generation • Updated Feb 9, 2024 • 12 • 27
nvidia/nemotron-3-8b-chat-4k-steerlm

Text Generation • Updated Feb 9, 2024 • 31 • 22

BigVGAN

BigVGAN is a universal neural vocoder that generates audio waveform using mel spectrogram as input.

Running

104

104

BigVGAN

🔊

Generate high-fidelity audio from input audio waveforms
nvidia/bigvgan_v2_44khz_128band_512x

Audio-to-Audio • Updated Sep 5, 2024 • 351k • 50
nvidia/bigvgan_v2_44khz_128band_256x

Audio-to-Audio • Updated Sep 5, 2024 • 1.63k • 7
nvidia/bigvgan_v2_24khz_100band_256x

Audio-to-Audio • Updated Sep 5, 2024 • 26.8k • 17

MambaVision

MambaVision: A Hybrid Mamba-Transformer Vision Backbone. Includes both 1K and 21K pretrained models.

nvidia/MambaVision-L3-512-21K

Image Classification • 0.7B • Updated Mar 29 • 203 • 51
nvidia/MambaVision-L3-256-21K

Image Classification • 0.7B • Updated Mar 29 • 11 • 7
nvidia/MambaVision-L2-512-21K

Image Classification • 0.2B • Updated Mar 29 • 646 • 3
nvidia/MambaVision-L-21K

Image Classification • 0.2B • Updated Mar 29 • 139 • 4

PS3: Scaling Vision Pre-Training to 4K Resolution

Enabling 4k resolution for VLMs, CVPR 2025, https://nvlabs.github.io/PS3/

nvidia/PS3-1.5K-SigLIP2

Image Feature Extraction • 1B • Updated 6 days ago • 49
nvidia/PS3-4K-SigLIP2

Image Feature Extraction • 1B • Updated 6 days ago • 3
nvidia/PS3_Lang-1.5K-SigLIP2

Image Feature Extraction • 0.5B • Updated 6 days ago • 3
nvidia/PS3_Lang-4K-SigLIP2

Image Feature Extraction • 0.6B • Updated 6 days ago • 5

Minitron

A family of compressed models obtained via pruning and knowledge distillation

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • 8B • Updated Aug 22, 2024 • 8.73k • 176
nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • 8B • Updated Oct 9, 2024 • 1.53k • 80
nvidia/Llama-3_1-Nemotron-51B-Instruct

Text Generation • 52B • Updated 30 days ago • 9.37k • 209
nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • 5B • Updated Feb 14 • 3.15k • 191

RADIO

A collection of Foundation Vision Models that combine multiple models (CLIP, DINOv2, SAM, etc.).

nvidia/C-RADIOv2-g

Image Feature Extraction • 1B • Updated Apr 17 • 29 • 12
nvidia/C-RADIOv2-H

0.7B • Updated Apr 17 • 2.95k • 6
nvidia/C-RADIOv2-L

0.3B • Updated Apr 17 • 309 • 2
nvidia/C-RADIOv2-B

Image Feature Extraction • 0.1B • Updated Apr 17 • 786 • 9

Llama3-ChatQA-2

This is the collection that presents ChatQA-2, a suite of 128K long-context models, that also have exceptional RAG capabilities

nvidia/Llama3-ChatQA-2-70B

Text Generation • Updated Sep 10, 2024 • 49 • 11
nvidia/Llama3-ChatQA-2-8B

Text Generation • Updated Sep 10, 2024 • 126 • 16
nvidia/ChatQA2-Long-SFT-data

Viewer • Updated Sep 9, 2024 • 117k • 319 • 30

NeMo Curator - Classifier Models

Classifier models that can be used in NeMo Curator for labelling/filtering datasets.

nvidia/domain-classifier

0.2B • Updated Jan 24 • 7.85k • 86
nvidia/quality-classifier-deberta

0.2B • Updated Jan 31 • 6.5k • 65
HuggingFaceFW/fineweb-edu-classifier

Text Classification • 0.1B • Updated Nov 17, 2024 • 11.2k • • 189
nvidia/Aegis-AI-Content-Safety-LlamaGuard-Defensive-1.0

Text Classification • Updated Jun 9 • 262k • 24

AI & ML interests

Recent Activity

Articles

Measuring Open-Source Llama Nemotron Models on DeepResearch Bench

Accelerate a World of LLMs on Hugging Face with NVIDIA NIM

OpenReasoning-Nemotron: A Family of State-of-the-Art Distilled Reasoning Models

Llama-NeMoRetriever-ColEmbed: Developer-Focused Guide to NVIDIA's State-of-the-Art Text-Image Retrieval

Welcome the NVIDIA Llama Nemotron Nano VLM to Hugging Face Hub

Introducing Cosmos Predict-2: A Foundation For Your Own World Model

Post-Training Isaac GR00T N1.5 for LeRobot SO-101 Arm

Supercharge Edge AI with High Accuracy Reasoning Using Llama Nemotron Nano 4B

Nemotron-Personas: Improve AI Training With the First Synthetic Personas Dataset Aligned to Real-World Distributions

Explore, Build, and Innovate AI Reasoning with NVIDIA’s Open Models and Recipes

NVIDIA's GTC 2025 Announcement for Physical AI Developers: New Open Models and Datasets

Mastering Long Contexts in LLMs with KVPress

Controlling Language Model Generation with NVIDIA's LogitsProcessorZoo

Team members 2,671

nvidia 's collections 54

Describe Anything

Cosmos Embed1