Kim Jiwan

JiwanKim

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

Script: Graph-Structured and Query-Conditioned Semantic Token Pruning for Multimodal Large Language Models

upvoted a paper 4 days ago

Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization

upvoted a paper 4 days ago

Qwen3-VL Technical Report

View all activity

Organizations

None yet

upvoted 3 papers 4 days ago

Script: Graph-Structured and Query-Conditioned Semantic Token Pruning for Multimodal Large Language Models

Paper • 2512.01949 • Published 7 days ago • 8

Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization

Paper • 2511.22586 • Published 11 days ago • 6

Qwen3-VL Technical Report

Paper • 2511.21631 • Published 12 days ago • 110

upvoted 2 papers 10 days ago

Monet: Reasoning in Latent Visual Space Beyond Images and Language

Paper • 2511.21395 • Published 12 days ago • 15

NVIDIA Nemotron Parse 1.1

Paper • 2511.20478 • Published 13 days ago • 20

upvoted a paper 11 days ago

Soft Adaptive Policy Optimization

Paper • 2511.20347 • Published 13 days ago • 33

upvoted a paper 12 days ago

Chain-of-Visual-Thought: Teaching VLMs to See and Think Better with Continuous Visual Tokens

Paper • 2511.19418 • Published 14 days ago • 26

upvoted 2 papers 14 days ago

SAM 3: Segment Anything with Concepts

Paper • 2511.16719 • Published 18 days ago • 108

SAM 3D: 3Dfy Anything in Images

Paper • 2511.16624 • Published 18 days ago • 106

upvoted a paper 18 days ago

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

Paper • 2511.14582 • Published 20 days ago • 17

upvoted 3 papers 19 days ago

MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation

Paper • 2511.09611 • Published 26 days ago • 68

P1: Mastering Physics Olympiads with Reinforcement Learning

Paper • 2511.13612 • Published 21 days ago • 132

Uni-MoE-2.0-Omni: Scaling Language-Centric Omnimodal Large Model with Advanced MoE, Training and Data

Paper • 2511.12609 • Published 22 days ago • 102

upvoted a paper 20 days ago

Depth Anything 3: Recovering the Visual Space from Any Views

Paper • 2511.10647 • Published 25 days ago • 93

upvoted a paper 22 days ago

Reinforcement Learning Improves Traversal of Hierarchical Knowledge in LLMs

Paper • 2511.05933 • Published about 1 month ago • 7

updated a model 23 days ago

JiwanKim/Qwen3-VL-4B-Instruct-trl-sft

Updated 23 days ago

updated a Space 23 days ago

Trackio

🚀

Visualize and track experiment metrics

published a Space 23 days ago

Trackio

🚀

Visualize and track experiment metrics

published a model 23 days ago

JiwanKim/Qwen3-VL-4B-Instruct-trl-sft

Updated 23 days ago

upvoted a paper 23 days ago

Music Flamingo: Scaling Music Understanding in Audio Language Models

Paper • 2511.10289 • Published 25 days ago • 10

Kim Jiwan

AI & ML interests

Recent Activity

Organizations

JiwanKim's activity

Trackio

Trackio