13point5
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test

18.1 MB

1 contributor

History: 26 commits

13point5's picture

Training in progress, step 110

6f32154 verified 7 months ago