HanSaem Kim

kensaem

AI & ML interests

None yet

Recent Activity

upvoted a paper about 12 hours ago

VINO: A Unified Visual Generator with Interleaved OmniModal Context

upvoted a paper about 12 hours ago

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

upvoted a paper about 12 hours ago

K-EXAONE Technical Report

View all activity

Organizations

None yet

upvoted 7 papers about 12 hours ago

VINO: A Unified Visual Generator with Interleaved OmniModal Context

Paper • 2601.02358 • Published 4 days ago • 28

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

Paper • 2601.01425 • Published 5 days ago • 46

K-EXAONE Technical Report

Paper • 2601.01739 • Published 5 days ago • 76

DreamStyle: A Unified Framework for Video Stylization

Paper • 2601.02785 • Published 3 days ago • 21

E-GRPO: High Entropy Steps Drive Effective Reinforcement Learning for Flow Models

Paper • 2601.00423 • Published 8 days ago • 8

Klear: Unified Multi-Task Audio-Video Joint Generation

Paper • 2601.04151 • Published 2 days ago • 12

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published about 22 hours ago • 83

upvoted a paper 2 days ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published 3 days ago • 77

upvoted an article 3 days ago

Article

Training strategies of Z-Image-Turbo

25 days ago

•

upvoted 2 papers 4 days ago

Deep Delta Learning

Paper • 2601.00417 • Published 8 days ago • 29

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

Paper • 2601.00664 • Published 7 days ago • 48

upvoted 8 papers 8 days ago

YOLO-Master: MOE-Accelerated with Specialized Transformers for Enhanced Real-time Detection

Paper • 2512.23273 • Published 11 days ago • 13

SpotEdit: Selective Region Editing in Diffusion Transformers

Paper • 2512.22323 • Published 14 days ago • 37

Diffusion Knows Transparency: Repurposing Video Diffusion for Transparent Object Depth and Normal Estimation

Paper • 2512.23705 • Published 11 days ago • 44

LiveTalk: Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation

Paper • 2512.23576 • Published 11 days ago • 64

DreamOmni3: Scribble-based Editing and Generation

Paper • 2512.22525 • Published 13 days ago • 14

upvoted a paper 12 days ago

Spatia: Video Generation with Updatable Spatial Memory

Paper • 2512.15716 • Published 23 days ago • 30

HanSaem Kim

AI & ML interests

Recent Activity

Organizations

kensaem's activity

Training strategies of Z-Image-Turbo