Shuhuai Ren (任抒怀)

About Me

I am a research scientist in Xiaomi MiMo. I was a PhD student at Language Computing and Machine Learning Group, School of CS, Peking University from 2020 to 2025, supervised by Prof. Xu Sun. Before joining PKU, I received BS in Software Engineering from Huazhong University of Science and Technology under the guidance of Prof. Kun He.

My research interests lie within (1) Vision-Language Foundation Models, (2) Understanding-Generation Unified Models.

News

[2025/06] One paper have been accepted by ICCV 2025.
[2025/02] Two papers has been accepted by CVPR 2025.
[2024/07] One paper has been accepted by ECCV 2024.
[2024/05] Two papers has been accepted by ACL 2024.
[2024/04] One paper has been accepted by NAACL 2024.
[2024/02] One paper has been accepted by CVPR 2024.
[2023/10] One paper has been accepted by EMNLP 2023.
[2023/09] Two papers have been accepted by NeurIPS 2023.
[2023/05] One paper has been accepted by ACL 2023.
[2021/08] Three papers have been accepted by EMNLP 2021.
[2021/05] One paper has been accepted by ACL 2021 as oral presentation.
[2019/05] One paper has been accepted by ACL 2019 as oral presentation.
[2019/02] I attended the Artificial Intelligence Winter Camp at The University of California, Berkeley and Stanford University.

Selected Publications (Full List)

Visual Understanding

MiMo-VL Technical Report

Shuhuai Ren (Core Contributor), et al

Arxiv 2025

Arxiv

Paper Code& Model

TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding

Shuhuai Ren*, Linli Yao*, Shicheng Li, Xu Sun, Lu Hou

CVPR 2024

Conference

Paper Code& Model

TESTA: Temporal-Spatial Token Aggregation for Long-form Video-Language Understanding

Shuhuai Ren, Sishuo Chen, Shicheng Li, Xu Sun, Lu Hou

Findings of EMNLP 2023 (Long Paper)

Conference

Paper Code& Model

Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis

Chaoyou Fu, Yuhan Dai, Yondong Luo, Lei Li, Shuhuai Ren, Renrui Zhang, Zihan Wang, Chenyu Zhou, Yunhang Shen, Mengdan Zhang, Peixian Chen, Yanwei Li, Shaohui Lin, Sirui Zhao, Ke Li, Tong Xu, Xiawu Zheng, Enhong Chen, Rongrong Ji, Xing Sun

CVPR 2025 (Highlights)

Conference

Paper Code& Model

Prompt Pre-Training with Twenty-Thousand Classes for Open-Vocabulary Visual Recognition

Shuhuai Ren, Aston Zhang, Yi Zhu, Shuai Zhang, Shuai Zheng, Mu Li, Alex Smola, Xu Sun

NeurIPS 2023

Conference

Paper Code& Model

Visual Generation

Next Block Prediction: Video Generation via Semi-Autoregressive Modeling

Shuhuai Ren, Shuming Ma, Xu Sun, Furu Wei

Arxiv 2025

Arxiv

Paper Code& Model

Parallelized Autoregressive Visual Generation

Yuqing Wang, Shuhuai Ren, Zhijie Lin, Yujin Han, Haoyuan Guo, Zhenheng Yang, Difan Zou, Jiashi Feng, Xihui Liu

CVPR 2025 (Highlights)

Conference

Paper Code& Model

TokenBridge: Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation

Yuqing Wang, Zhijie Lin, Yao Teng, Yuanzhi Zhu, Shuhuai Ren, Jiashi Feng, Xihui Liu

ICCV 2025

Conference

Paper Code& Model

Selected Awards and Competitions

Peking University (PKU), Sep. 2020 - Jul. 2025 (Expected)

National Scholarship, 2024

Merit Student Pacesetter, 2024

NeurIPS Scholar Award, 2023

The third Prize of Peking University Scholarship, 2020-21

Award for Scientific Research, 2020-22

Huazhong University of Science and Technology (HUST), Sep. 2016 - Jul. 2020

Pacemaker to Merit Student (The highest honor of undergraduate students), 2017-18

National Scholarship of China, 2017-18

Outstanding Graduates of HUST, 2020

Outstanding Undergraduate Thesis, 2020

Baosteel Scholarship, 2019

Hainan Airlines Scholarship, 2016-17

American College Students Mathematical Modeling Competition (MCM/ICM), Honorable Mention, 2018

Academic Service

Reviewer/Program committee for conferences: CVPR (2025 Outstanding Reviewer Award), ICCV (2025), ICLR (2023-25), NeurIPS (2023-25), ICML (2025), ACL (2021 Outstanding Reviewer Award-23), EMNLP (2021-23), NAACL (2022-23)

Reviewer for journals: TPAMI, IJCV

Teaching assistant: Introduction to Natural Language processing (PKU, 2021 Fall), Artificial Intelligence Frontier and Industry Trends (PKU, 2022 Spring)