5 7 16

Richard

menghanxia

https://menghanxia.github.io/

AI & ML interests

computer vision and graphics

Recent Activity

liked a Space 12 days ago

Qwen/Qwen2.5-Omni-7B-Demo

liked a dataset about 2 months ago

ttgroup/blueneg-release

upvoted a paper 2 months ago

UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution

View all activity

Organizations

liked a Space 12 days ago

Qwen2.5 Omni 7B Demo

🏆

363

Generate text and speech from text, audio, images, and videos

liked a dataset about 2 months ago

ttgroup/blueneg-release

Preview • Updated Aug 4 • 4.03k • 3

upvoted a paper 2 months ago

UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution

Paper • 2510.08143 • Published Oct 9 • 20

upvoted 2 papers 9 months ago

Position: Interactive Generative Video as Next-Generation Game Engine

Paper • 2503.17359 • Published Mar 21 • 61

Can Large Vision Language Models Read Maps Like a Human?

Paper • 2503.14607 • Published Mar 18 • 10

authored a paper 9 months ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 145

upvoted a paper 9 months ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 145

authored 2 papers 12 months ago

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Paper • 2412.07760 • Published Dec 10, 2024 • 55

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

Paper • 2412.07759 • Published Dec 10, 2024 • 18

upvoted 3 papers 12 months ago

StyleMaster: Stylize Your Video with Artistic Generation and Translation

Paper • 2412.07744 • Published Dec 10, 2024 • 20

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Paper • 2412.07760 • Published Dec 10, 2024 • 55

3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation

Paper • 2412.07759 • Published Dec 10, 2024 • 18

updated 2 Spaces about 1 year ago

ReversibleHalftoning

🚀

Disco

🐠

authored a paper over 1 year ago

FreeTraj: Tuning-Free Trajectory Control in Video Diffusion Models

Paper • 2406.16863 • Published Jun 24, 2024 • 11

liked a Space over 1 year ago

DynamiCrafter

🐨

166

Generate animated videos from images and text prompts

authored 3 papers almost 2 years ago

Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation

Paper • 2402.10491 • Published Feb 16, 2024 • 18

ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with Diffusion Models

Paper • 2310.07702 • Published Oct 11, 2023

DynamiCrafter: Animating Open-domain Images with Video Diffusion Priors

Paper • 2310.12190 • Published Oct 18, 2023 • 13

liked a Space almost 2 years ago

FreeNoise

🌖