To Read - a PTEdward Collection

PTEdward 's Collections

To Read

To Read

updated Aug 11, 2025

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

Paper • 2501.06186 • Published Jan 10, 2025 • 65
apple/OpenELM

Updated May 2, 2024 • 1.44k
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

Text Generation • 2B • Updated Feb 24, 2025 • 1.07M • • 1.43k
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 434
UloRL:An Ultra-Long Output Reinforcement Learning Approach for Advancing Large Language Models' Reasoning Abilities

Paper • 2507.19766 • Published Jul 26, 2025 • 14
Qwen/Qwen-Image

Text-to-Image • Updated Aug 18, 2025 • 229k • • 2.34k