Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

arxiv: 2501.13921

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

9

Full-text search

Active filters: 2501.13921

MediaTek-Research/Llama-Breeze2-8B-Instruct

8B • Updated Mar 2 • 1.45k • 46

MediaTek-Research/Llama-Breeze2-3B-Instruct

4B • Updated Mar 2 • 1.46k • 28

MediaTek-Research/BreezyVoice

Updated Feb 18 • 47

Qwe1325/Llama-Breeze2-8B-Instruct_4bit

5B • Updated Feb 26 • 4

Qwe1325/Llama-Breeze2-3B-Instruct_4bit

2B • Updated Feb 27 • 11

Qwe1325/Llama-Breeze2-8B-Instruct_8bit

8B • Updated Feb 28 • 4

Qwe1325/Llama-Breeze2-3B-Instruct_8bit

4B • Updated Feb 28 • 3

twinkle-ai/Llama-3.2-3B-F1-Instruct

Text Generation • 4B • Updated Apr 30 • 345 • 16

ThanatosDi/Llama-Breeze2-8B-Instruct

Updated May 6 • 3