AaronHuangWei
/

Qwen2.5-7B-GRPO-MATH500-lora64

Generated from Trainer

Model card Files Files and versions

Qwen2.5-7B-GRPO-MATH500-lora64

Commit History

Training in progress, step 100

9eebab1
verified

AaronHuangWei commited on Aug 14

Training in progress, step 50

c750ac4
verified

AaronHuangWei commited on Aug 14

initial commit

395ddd4
verified

AaronHuangWei commited on Aug 14