Jiuxiang Gu

Research Scientist

Maryland

Jiuxiang Gu is a Research Scientist in the Document Intelligence Lab (DIL) of Adobe Research at Maryland site. He obtained his Ph.D. degree at Nanyang Technological University (NTU), Singapore, where he focused on the fusion of deep learning and reasoning for computer vision, such as image captioning, cross-modal retrieval, scene graph generation, visual question answering and so on.

His research interests lie at the intersection of computer vision and natural language processing. His contact email is jigu@adobe.com, and more information is available on his personal website.

Publications

A Survey on LLM-based Conversational User Simulation

Ni, Bo., Wang, Yu., Wang, Leyao., Kveton, Branislav., Dernoncourt, Franck., Xia, Yu., Chen, Hongjie., Luera, Reuben., Basu, Samyadeep., Mukherjee, Subhojyoti., Mathur, Puneet., Ahmed, Nesreen., Wu, Junda., Li, Li., Zhang, Huixin., Zhang, Ruiyi., Yu, Tong., Kim, Sungchul., Gu, Jiuxiang., Tu, Zhengzhong., Siu, Alexa., Wang, Zichao., Yoon, David., Lipka, Nedim., Park, Namyong., Lin, Zihao., Bui, Trung., Zhao, Yue., Derr, Tyler., Rossi, Ryan. (Mar. 29, 2026)

EACL 2026

VipAct: Visual-Perception Enhancement via Specialized VLM Agent Collaboration and Tool-use

Zhang, Zhehao., Rossi, Ryan., Yu, Tong., Dernoncourt, Franck., Zhang, Ruiyi., Gu, Jiuxiang., Kim, Sungchul., Chen, Xiang., Wang, Zichao., Lipka, Nedim. (Jan. 27, 2026)

AAAI 2026

A Survey on Small Language Models

Van Nguyen, Chien., Shen, Xuan., Aponte, Ryan., Xia, Yu., Basu, Samyadeep., Hu, Zhengmian., Chen, Jian., Parmar, Mihir., Kunapuli, Sasidhar., Barrow, Joe., Wu, Junda., Singh, Ashish., Wang, Yu., Gu, Jiuxiang., Ahmed, Nesreen., Lipka, Nedim., Zhang, Ruiyi., Chen, Xiang., Yu, Tong., Kim, Sungchul., Deilamsalehy, Hanieh., Park, Namyong., Rimer, Michael., Zhang, Zhehao., Yang, Huanrui., Mathur, Puneet., Wu, Gang., Dernoncourt, Franck., Rossi, Ryan., Nguyen, Thien. (Sep. 10, 2025)

RANLP 2025

Multi-LLM Debiasing Framework

Owens, Deonna., Rossi, Ryan., Kim, Sungchul., Yu, Tong., Dernoncourt, Franck., Chen, Xiang., Zhang, Ruiyi., Gu, Jiuxiang., Deilamsalehy, Hanieh., Lipka, Nedim. (Sep. 10, 2025)

RANLP 2025

From Selection to Generation: A Survey of LLM-based Active Learning

Xia, Yu., Mukherjee, Subhojyoti., Xie, Zhouhang., Wu, Junda., Li, Xintong., Aponte, Ryan., Lyu, Hanjia., Barrow, Joe., Chen, Hongjie., Dernoncourt, Franck., Kveton, Branislav., Yu, Tong., Zhang, Ruiyi., Gu, Jiuxiang., Ahmed, Nesreen., Wang, Yu., Chen, Xiang., Deilamsalehy, Hanieh., Kim, Sungchul., Hu, Zhengmian., Zhao, Yue., Lipka, Nedim., Yoon, David., Huang, Ting-Hao., Wang, Zichao., Mathur, Puneet., Pal, Soumyabrata., Mukherjee, Koyel., Zhang, Zhehao., Park, Namyong., Nguyen, Thien., Luo, Jiebo., Rossi, Ryan., McAuley, Julian. (Aug. 1, 2025)

ACL 2025

Personalization of Large Language Models: A Survey

Zhang, Zhehao., Rossi, Ryan., Kveton, Branislav., Shao, Yijia., Yang, Diyi., Zamani, Hamed., Dernoncourt, Franck., Barrow, Joe., Yu, Tong., Kim, Sungchul., Zhang, Ruiyi., Gu, Jiuxiang., Derr, Tyler., Chen, Hongjie., Wu, Junda., Chen, Xiang., Wang, Zichao., Mitra, Subrata., Lipka, Nedim., Ahmed, Nesreen., Wang, Yu. (Jun. 30, 2025)

TMLR 2025

Self-Debiasing Large Language Models: Zero-Shot Recognition and Reduction of Stereotypes

Gallegos, Isabel., Aponte, Ryan., Rossi, Ryan., Barrow, Joe., Tanjim, Mehrab., Yu, Tong., Deilamsalehy, Hanieh., Zhang, Ruiyi., Kim, Sungchul., Dernoncourt, Franck., Lipka, Nedim., Owens, Deonna., Gu, Jiuxiang. (May. 4, 2025)

NAACL 2025

SV-RAG: LoRA-Contextualizing Adaptation of MLLMs for Long Document Understanding

Chen, Jian., Zhang, Ruiyi., Zhou, Yufan., Yu, Tong., Dernoncourt, Franck., Gu, Jiuxiang., Rossi, Ryan., Chen, Changyou., Sun, Tong. (Apr. 28, 2025)

ICLR 2025

Advancing Vision-Language Models with Adapter Ensemble Strategies

Bai, Yue., Zhao, Handong., Lin, Zhe., Kale, Ajinkya., Gu, Jiuxiang., Yu, Tong., Kim, Sungchul., Fu, Yun. (Nov. 12, 2024)

EMNLP

Customization Assistant for Text-to-image Generation

Zhou, Yufan., Zhang, Ruiyi., Gu, Jiuxiang., Sun, Tong. (Jun. 17, 2024)

CVPR 2024

TRINS: Towards Multimodal Language Models that Can Read

Zhang, Ruiyi., Zhang, Yanzhe., Chen, Jian., Zhou, Yufan., Gu, Jiuxiang., Chen, Changyou., Sun, Tong. (Jun. 17, 2024)

CVPR 2024

DocScript: New Task, Dataset, and Models for Document-level Script Event Prediction

Mathur, Puneet., Morariu, Vlad., Garimella, Aparna., Dernoncourt, Franck., Gu, Jiuxiang., Sawhney, Ramit., Nakov, Preslav., Manocha, Dinesh., Jain, Rajiv. (May. 25, 2024)

LREC-COLING 2024

LRM: Large Reconstruction Model for Single Image to 3D

Hong, Yicong., Zhang, Kai., Gu, Jiuxiang., Bi, Sai., Zhou, Yang., Liu, Difan., Liu, Feng., Sunkavalli, Kalyan., Bui, Trung., Tan, Hao. (May. 7, 2024)

ICLR 2024

Learning the Visualness of Text Using Large Vision-Language Models

Verma, Gaurav., Rossi, Ryan., Tensmeyer, Chris., Gu, Jiuxiang., Nenkova, Ani. (Dec. 1, 2023)

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing

DocEdit: Language-guided Document Editing

Mathur, Puneet., Jain, Rajiv., Gu, Jiuxiang., Dernoncourt, Franck., Manocha, Dinesh., Morariu, Vlad. (Feb. 14, 2023)

AAAI 2023

LayerDoc: Layer-wise Extraction of Spatial Hierarchical Structure in Visually-Rich Documents

Mathur, Puneet., Jain, Rajiv., Mehra, Ashutosh., Gu, Jiuxiang., Dernoncourt, Franck., Natarajan, Anandhavelu., Tran, Quan., Kaynig-Fittkau, Verena., Nenkova, Ani., Manocha, Dinesh., Morariu, Vlad. (Jan. 6, 2023)

WACV 2023

User-Entity Differential Privacy in Learning Natural Language Models

Lai, Phung., Phan, NhatHai., Sun, Tong., Jain, Rajiv., Dernoncourt, Franck., Gu, Jiuxiang., Barmpalios, Nikolaos. (Dec. 20, 2022)

2022 IEEE International Conference on Big Data

MGDoc: Pre-training with Multi-granular Hierarchy for Document Image Understanding

Wang, Zilong., Gu, Jiuxiang., Tensmeyer, Chris., Barmpalios, Nikolaos., Nenkova, Ani., Sun, Tong., Shang, Jingbo., Morariu, Vlad. (Dec. 1, 2022)

Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing

EI-CLIP: Entity-Aware Interventional Contrastive Learning for E-Commerce Cross-Modal Retrieval

Ma, Haoyu., Zhao, Handong., Lin, Zhe., Kale, Ajinkya., Wang, Zhangyang., Yu, Tong., Gu, Jiuxiang., Choudhary, Sunav., Xie, Xiaohui. (Sep. 27, 2022)

IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

DocLayoutTTS: Dataset and Baselines for Layout-informed Document-level Neural Speech Synthesis

Mathur, Puneet., Dernoncourt, Franck., Tran, Quan., Gu, Jiuxiang., Nenkova, Ani., Morariu, Vlad., Jain, Rajiv., Manocha, Dinesh. (Sep. 22, 2022)

Interspeech 2022

DocTime: A Document-level Temporal Dependency Graph Parser

Mathur, Puneet., Morariu, Vlad., Kaynig-Fittkau, Verena., Gu, Jiuxiang., Dernoncourt, Franck., Tran, Quan., Nenkova, Ani., Manocha, Dinesh., Jain, Rajiv. (Jul. 15, 2022)

NAACL 2022

TiGAN: Text-Based Interactive Image Generation and Manipulation

Zhou, Yufan., Zhang, Ruiyi., Gu, Jiuxiang., Tensmeyer, Chris., Yu, Tong., Chen, Changyou., Xu, Jinhui., Sun, Tong. (Jun. 28, 2022)

Proceedings of the AAAI Conference on Artificial Intelligence

Towards Language-Free Training for Text-to-Image Generation

Zhou, Yufan., Zhang, Ruiyi., Chen, Changyou., Li, Chunyuan., Tensmeyer, Chris., Yu, Tong., Gu, Jiuxiang., Xu, Jinhui., Sun, Tong. (Jun. 19, 2022)

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition

Multi-Scale Aligned Distillation for Low-Resolution Detection

Qi, Lu., Kuen, Jason., Gu, Jiuxiang., Lin, Zhe., Wang, Yi., Chen, Yukang., Li, Yanwei., Jia, Jiaya. (Jun. 21, 2021)

Conference on Computer Vision and Pattern Recognition (CVPR'21)

Towards Interpreting and Mitigating Shortcut Learning Behavior of NLU models

Du, Mengnan., Manjunatha, Varun., Jain, Rajiv., Deshpande, Ruchi., Dernoncourt, Franck., Gu, Jiuxiang., Sun, Tong., Hu, Xia. (Jun. 11, 2021)

NAACL 2021