moodlep
/

smollm2-17b-dpo-cai-v1

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions

Metrics Training metrics Community

smollm2-17b-dpo-cai-v1 / adapter_model.safetensors

Commit History

Training in progress, step 257

3502899
verified

moodlep commited on Jan 9

Training in progress, step 200

a0fe6cf
verified

moodlep commited on Jan 9

Training in progress, step 100

b1e40b1
verified

moodlep commited on Jan 9