Zuxuan Wu - Fudan University

Zuxuan Wu

Associate Professor
School of Computer Science, Fudan University

Biography

I am an Associate Professor in School of Computer Science at Fudan University, and a member of the Fudan Vision and Learning Laboratory. I recieved my Ph.D. in Computer Science from the University of Maryland with Prof. Larry Davis in 2020. My research interests are in computer vision and deep learning. My current research particularly focuses on large-scale video understanding, video generation, and efficient architectures.

I'm currently looking for students with strong coding skills who are excited to design algorithms for visual understanding. If you are interested in working with me, please send me an email.

Publication

SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation.
European Conference on Computer Vision (ECCV), Milano, Italy, Sept., 2024.
Lingchen Meng, Shiyi Lan, Hengduo Li, Jose M. Alvarez, Zuxuan Wu, Yu-Gang Jiang
PromptFusion: Decoupling Stability and Plasticity for Continual Learning.
European Conference on Computer Vision (ECCV), Milano, Italy, Sept., 2024.
Haoran Chen, Zuxuan Wu, Xintong Han, Menglin Jia, Yu-Gang Jiang
MagDiff: Multi-Alignment Diffusion for High-Fidelity Video Generation and Editing.
European Conference on Computer Vision (ECCV), Milano, Italy, Sept., 2024.
Haoyu Zhao, Tianyi Lu, Jiaxi Gu, Xing Zhang, Qingping Zheng, Zuxuan Wu, Hang Xu, Yu-Gang Jiang
OmniViD: A Generative Framework for Universal Video Understanding.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024.
Junke Wang, Dongdong Chen, Chong Luo, Bo He, Lu Yuan, Zuxuan Wu, Yu-Gang Jiang
MotionEditor: Editing Video Motion via Content-Aware Diffusion.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024.code
Shuyuan Tu, Qi Dai, Zhi-Qi Cheng, Han Hu, Xintong Han, Zuxuan Wu, Yu-Gang Jiang
SimDA: Simple Diffusion Adapter for Efficient Video Generation.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024.
Zhen Xing, Qi Dai, Han Hu, Zuxuan Wu, Yu-Gang Jiang
Learning to Rank Patches for Unbiased Image Redundancy Reduction.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024.
Yang Luo, Zhineng Chen, Peng Zhou, Zuxuan Wu, Xieping Gao, Yu-Gang Jiang
Synthesize Diagnose and Optimize: Towards Fine-Grained Vision-Language Understanding.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024. code
Wujian Peng, Sicheng Xie, Zuyao You, Shiyi Lan, Zuxuan Wu
BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, USA, June, 2024.
Zhenxin Li, Shiyi Lan, Jose M. Alvarez, Zuxuan Wu
Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation.
Advances in Neural Information Processing Systems (NeurIPS), New Orleans, USA, Dec., 2023.
Haoran Chen, Xintong Han, Zuxuan Wu, Yu-Gang Jiang
Learning from Rich Semantics and Coarse Locations for Long-tailed Object Detection.
Advances in Neural Information Processing Systems (NeurIPS), New Orleans, USA, Dec., 2023. code
Lingchen Meng, Xiyang Dai, Jianwei Yang, Dongdong Chen, Yinpeng Chen, Mengchen Liu, Yi-Ling Chen, Zuxuan Wu, Lu Yuan, Yu-Gang Jiang
Implicit Temporal Modeling with Learnable Alignment for Video Recognition.
International Conference on Computer Vision (ICCV), Paris, France, Oct., 2023 (Oral) code
Shuyuan Tu, Qi Dai, Zuxuan Wu, Zhi-Qi Cheng, Han Hu, Yu-Gang Jiang
Open-VCLIP: Transforming CLIP to an Open-vocabulary Video Model via Interpolated Weight Optimization.
International Conference on Machine Learning (ICML), Hawaii, USA, July, 2023
Zejia Weng, Xitong Yang, Ang Li, Zuxuan Wu, Yu-Gang Jiang
ResFormer: Scaling ViTs with Multi-Resolution Training.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Rui Tian, Zuxuan Wu, Qi Dai, Han Hu, Yu Qiao, Yu-Gang Jiang
SVFormer: Semi-Supervised Video Transformer for Action Recognition.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Zhen Xing, Qi Dai, Han Hu, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang
Detection Hub: Unifying Object Detection Datasets via Query Adaptation on Language Embedding.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Lingchen Meng, Xiyang Dai, Yinpeng Chen, Pengchuan Zhang, Dongdong Chen, Mengchen Liu, Jianfeng Wang, Zuxuan Wu, Lu Yuan, Yu-Gang Jiang
Look Before You Match: Instance Understanding Matters in Video Object Segmentation.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Junke Wang, Dongdong Chen, Zuxuan Wu, Chong Luo, Chuanxin Tang, Xiyang Dai, Yucheng Zhao, Yujia Xie, Lu Yuan, Yu-Gang Jiang
Masked Video Distillation: Rethinking Masked Feature Modeling for Self-supervised Video Representation Learning.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Rui Wang, Dongdong Chen, Zuxuan Wu, Yinpeng Chen, Xiyang Dai, Mengchen Liu, Lu Yuan, Yu-Gang Jiang
Prototypical Residual Networks for Anomaly Detection and Localization.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Hui Zhang, Zuxuan Wu, Zheng Wang, Zhineng Chen, Yu-Gang Jiang
Enhancing the Self-Universality for Transferable Targeted Attacks.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Zhipeng Wei, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang
Vision Transformers are Good Mask Auto-Labelers.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Shiyi Lan, Xitong Yang, Zhiding Yu, Zuxuan Wu, Jose M. Alvarez, Anima Anandkumar
Towards Scalable Neural Representation for Diverse Videos.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, June, 2023
Bo He, Xitong Yang, Hanyu Wang, Zuxuan Wu, Hao Chen, Shuaiyi Huang, Yixuan Ren, Ser-Nam Lim, Abhinav Shrivastava
Resolving Task Confusion in Dynamic Expansion Architectures for Class Incremental Learning.
The AAAI Conference on Artificial Intelligence (AAAI), Washington DC, USA, Feb., 2023
Bingchen Huang, Zhineng Chen, Peng Zhou, Jiayin Chen, Zuxuan Wu
OmniVL: One Foundation Model for Image-Language and Video-Language Tasks.
Advances in Neural Information Processing Systems (NeurIPS), New Orleans, USA, Dec., 2022.
Junke Wang, Dongdong Chen, Zuxuan Wu, Chong Luo, Luowei Zhou, Yucheng Zhao, Yujia Xie, Ce Liu, Yu-Gang Jiang, Lu Yuan
Semi-Supervised Vision Transformers.
European Conference on Computer Vision (ECCV), Tel Aviv, October, 2022. code
Zejia Weng, Xitong Yang, Ang Li, Zuxuan Wu, Yu-Gang Jiang
Efficient Video Transformers with Spatial-Temporal Token Selection.
European Conference on Computer Vision (ECCV), Tel Aviv, October, 2022. code
Junke Wang, Xitong Yang, Hengduo Li, Li Liu, Zuxuan Wu, Yu-Gang Jiang
Semi-Supervised Single-View 3D Reconstruction via Prototype Shape Priors.
European Conference on Computer Vision (ECCV), Tel Aviv, October, 2022. code
Zhen Xing, Hengduo Li, Zuxuan Wu, Yu-Gang Jiang
BEVT: BERT Pretraining of Video Transformers.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, June, 2022 code
Rui Wang, Dongdong Chen, Zuxuan Wu, Yinpeng Chen, Xiyang Dai, Mengchen Liu, Yu-Gang Jiang, Luowei Zhou, Lu Yuan
Cross-Modal Transferable Adversarial Attacks from Images to Videos.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, June, 2022
Zhipeng Wei, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang
AdaViT: Adaptive Vision Transformers for Efficient Image Recognition.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, June, 2022
Lingchen Meng, Hengduo Li, Bor-Chun Chen, Shiyi Lan, Zuxuan Wu, Yu-Gang Jiang, Ser-Nam Lim
ObjectFormer for Image Manipulation Detection and Localization.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, June, 2022
Junke Wang, Zuxuan Wu, Jingjing Chen, Xintong Han, Abhinav Shrivastava, Ser-Nam Lim, Yu-Gang Jiang
Flag: Adversarial data augmentation for graph neural networks.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, USA, June, 2022
Kezhi Kong, Guohao Li, Mucong Ding, Zuxuan Wu, Chen Zhu, Bernard Ghanem, Gavin Taylor, Tom Goldstein
Boosting the Transferability of Video Adversarial Examples via Temporal Translation.
The AAAI Conference on Artificial Intelligence (AAAI), Virtual, Feb., 2022
Zhipeng Wei, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang
Attacking Video Recognition Models with Bullet-Screen Comments.
The AAAI Conference on Artificial Intelligence (AAAI), Virtual, Feb., 2022
Kaichen, Zhipeng Wei, Jingjing Chen, Zuxuan Wu, Yu-Gang Jiang
Towards Transferable Adversarial Attacks on Vision Transformers.
The AAAI Conference on Artificial Intelligence (AAAI), Virtual, Feb., 2022
Zhipeng Wei, Jingjing Chen, Micah Goldblum, Zuxuan Wu, Tom Goldstein, Yu-Gang Jiang
Rethinking Pseudo Labels for Semi-Supervised Object Detection.
The AAAI Conference on Artificial Intelligence (AAAI), Virtual, Feb., 2022
Hengduo Li, Zuxuan Wu, Abhinav Shrivastava, Larry Davis
Encoding Robustness to Image Style via Adversarial Feature Perturbations.
Advances in Neural Information Processing Systems (NeurIPS), Virtual, Dec., 2021.
Manli Shu, Zuxuan Wu, Micah Goldblum, Tom Goldstein
Deep Video Inpainting Detection.
British Machine Vision Conference (BMVC), Virtual, Oct., 2021
Peng Zhou, Ning Yu, Zuxuan Wu, Larry Davis, Abhinav Shrivastava, Ser-Nam Lim
GTA: Global Temporal Attention for Video Action Understanding.
British Machine Vision Conference (BMVC), Virtual, Oct., 2021
Bo He, Xitong Yang, Zuxuan Wu, Hao Chen, Ser-Nam Lim, Abhinav Shrivastava
VideoLT: Large-scale Long-tailed Video Recognition.
International Conference on Computer Vision (ICCV), Virtual, Oct., 2021
Xing Zhang, Zuxuan Wu, Zejia Weng, Huazhu Fu, Jingjing Chen, Yu-Gang Jiang, Larry Davis
Exploring Visual Engagement Signals for Representation Learning.
International Conference on Computer Vision (ICCV), Virtual, Oct., 2021
Menglin Jia, Zuxuan Wu, Austin Reiter, Claire Cardie, Serge Belongie, Ser-Nam Lim
2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video Recognition.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Virtual, June, 2021
Hengduo Li, Zuxuan Wu, Abhinav Shrivastava, Larry S. Davis
Intentonomy: a Dataset and Study towards Human Intent Understanding.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Virtual, June, 2021 (Oral) code
Menglin Jia, Zuxuan Wu, Austin Reiter, Claire Cardie, Serge Belongie, Ser-Nam Lim
Efficient Object Embedding for Manipulated Image Retrieval.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Virtual, June, 2021
Bor-Chun Chen, Zuxuan Wu, Larry S. Davis, Ser-Nam Lim
Making an Invisibility Cloak: Real World Adversarial Attacks on Object Detectors.
European Conference on Computer Vision (ECCV), Virtual, August, 2020. code
Zuxuan Wu, Ser-Nam Lim, Larry S. Davis, Tom Goldstein
Learning from Noisy Anchors for One-stage Object Detection.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Virtual, June, 2020
Hengduo Li, Zuxuan Wu, Chen Zhu, Caiming Xiong, Richard Socher, Larry S. Davis
LiteEval: A Coarse-to-Fine Framework for Resource Efficient Video Recognition.
Advances in Neural Information Processing Systems (NeurIPS), Vancouver, Canada, Dec., 2019. code
Zuxuan Wu, Caiming Xiong, Yu-Gang Jiang, Larry S. Davis
FiNet: Compatible and Diverse Fashion Image Inpainting.
International Conference on Computer Vision (ICCV), Seoul, Korea, Oct., 2019. (Oral)
Xintong Han, Zuxuan Wu, Weilin Huang, Matthew R. Scott, Larry S. Davis
ACE: Adapting to Changing Environments for Semantic Segmentation.
International Conference on Computer Vision (ICCV), Seoul, Korea, Oct., 2019
Zuxuan Wu, Xin Wang, Joseph E. Gonzalez, Tom Goldstein, Larry S. Davis
AdaFrame: Adaptive Frame Selection for Fast Video Recognition.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, USA, June, 2019
Zuxuan Wu, Caiming Xiong, Chih-Yao Ma, Richard Socher, Larry S Davis
The Regretful Agent: Heuristic-Aided Navigation through Progress Estimation.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, USA, June, 2019
Chih-Yao Ma, Zuxuan Wu, Ghassan AlRegib, Caiming Xiong, Zsolt Kira
Visual Content Recognition by Exploiting Semantic Feature Map with Attention and Multi-task Learning.
ACM Trans. Multimedia Comput. Commun (ACM TOMM), vol. 15, issue 1, pp. 6:1-6:22, 2019.
Rui-Wei Zhao, Qi Zhang, Zuxuan Wu, Jianguo Li, Yu-Gang Jiang
Self-Monitoring Navigation Agent via Auxiliary Progress Estimation.
International Conference on Learning Representations (ICLR), New Orleans, USA, May, 2019
Chih-Yao Ma, Jiasen Lu, Zuxuan Wu, Ghassan AlRegib, Zsolt Kira, Richard Socher, Caiming Xiong
DCAN: Dual Channel-wise Alignment Networks for Unsupervised Scene Adaptation.
European Conference on Computer Vision (ECCV), Munich, Germany, September, 2018. code
Zuxuan Wu, Xintong Han, Yen-Liang Lin, Mustafa Gkhan Uzunbas, Tom Goldstein, Ser Nam Lim, Larry S. Davis
BlockDrop: Dynamic Inference Paths in Residual Networks.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Salt Lake City, USA, June, 2018. (Spotlight) code
Zuxuan Wu*, Tushar Nagarajan*, Abhishek Kumar, Steven Rennie, Larry S. Davis, Kristen Grauman, Rogerio Feris (* denotes equal contribution)
VITON: An Image-based Virtual Try-on Network.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Salt Lake City, USA, June, 2018. (Spotlight) code
Xintong Han, Zuxuan Wu, Zhe Wu, Ruichi Yu, Larry S. Davis
Exploiting Feature and Class Relationships in Video Categorization with Regularized Deep Neural Networks.
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), Vol. 40, Issue 2, pp. 352-364, 2018.
Yu-Gang Jiang, Zuxuan Wu, Jun Wang, Xiangyang Xue, Shih-Fu Chang
Fudan-Columbia Video Dataset (FCVID), one of the largest public Web video datasets with manual annotations.
Deep Learning for Video Classification and Video Captioning.
In Frontiers of Multimedia Research, Shih-Fu Chang (Ed.), ACM Morgan & Claypool, New York, NY, USA, pp. 3-29, 2018
Zuxuan Wu, Ting Yao, Yanwei Fu, Yu-Gang Jiang
Surveying 100+ recent literatures on video classification and captioning with deep learning.
Weakly-Supervised Spatial Context Networks.
arXiv preprint arXiv:1704.02998
Zuxuan Wu, Larry S. Davis, Leonid Sigal
Automatic Spatially-aware Fashion Concept Discovery.
International Conference on Computer Vision (ICCV), Venice, Italy, Oct., 2017
Xintong Han, Zuxuan Wu, Phoenix Huang, Xiao Zhang, Menglong Zhu, Yuan Li, Yang Zhao, Larry S. Davis
Learning Fashion Compatibility with Bidirectional LSTMs.
ACM Multimedia (ACM MM), Mountain View, USA, Oct., 2017
Xintong Han, Zuxuan Wu, Yu-Gang Jiang, Larry S. Davis
Learning Semantic Feature Map for Visual Content Recognition.
ACM Multimedia (ACM MM), Mountain View, USA, Oct., 2017
Rui-Wei Zhao, Zuxuan Wu, Jianguo Li, Yu-Gang Jiang
Harnessing Object and Scene Semantics for Large-Scale Video Understanding.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, USA, June, 2016. (Spotlight)
Zuxuan Wu, Yanwei Fu, Yu-Gang Jiang, Leonid Sigal
Featured in Tech2, ACM Technews
Multi-Stream Multi-Class Fusion of Deep Networks for Video Classification.
ACM Multimedia (ACM MM), Amsterdam, the Netherlands, Oct., 2016. (Oral Paper)
Zuxuan Wu, Yu-Gang Jiang, Xi Wang, Hao Ye, Xiangyang Xue
Modeling Spatial-Temporal Clues in a Hybrid Deep Learning Framework for Video Classification.
ACM Multimedia (ACM MM), Brisbane, Australia, Oct., 2015. (Oral Paper)
Zuxuan Wu, Xi Wang, Yu-Gang Jiang, Hao Ye, Xiangyang Xue
Obtain 91.3% accuracy on the UCF-101 dataset.
Evaluating Two-Stream CNN for Video Classification.
ACM International Conference on Multimedia Retrieval (ICMR), Shanghai, China, June, 2015 motion CNN model
Hao Ye, Zuxuan Wu, Rui-Wei Zhao, Xi Wang, Yu-Gang Jiang, Xiangyang Xue
Exploring Inter-feature and Inter-class Relationships with Deep Neural Networks for Video Classification.
ACM Multimedia (ACM MM), Orlando, USA, Nov., 2014. (Oral Paper)
Zuxuan Wu, Yu-Gang Jiang, Jun Wang, Jian Pu, Xiangyang Xue

Professional Service

Area Chair:
- Advances in Neural Information Processing Systems 2023-2024
- IEEE Conference on Computer Vision and Pattern Recognition 2023-2024
Senior Program Committee:
- AAAI Conference on Artificial Intelligenc 2023-2024
- International Joint Conference on Artificial Intelligence 2023