VLMs - a Grzegorz Collection

Grzegorz 's Collections

VLMs

Engineering with LLMs

VLMs

updated Oct 2, 2025

LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding

Paper • 2501.08282 • Published Jan 14, 2025
Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play

Paper • 2509.25541 • Published Sep 29, 2025 • 140