baseten
/

Llama-3.2-3B-Instruct-fp8nokv

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-fp8nokv / hf_quant_config.json

michaelfeil's picture

Upload folder using huggingface_hub

6a0e0d5 verified 3 months ago

history blame contribute delete

239 Bytes

	{
	"producer": {
	"name": "modelopt",
	"version": "0.31.0"
	},
	"quantization": {
	"quant_algo": "FP8",
	"kv_cache_quant_algo": null,
	"exclude_modules": [
	"lm_head"
	]
	}
	}