alphadl
/

R1-Distill-0.6B-Qwen-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

R1-Distill-0.6B-Qwen-GRPO

1.21 GB

1 contributor

History: 221 commits

alphadl's picture

Update README.md

153e3fe verified 7 months ago