I am now a fourth-year PhD candidate at AML Lab CityU HK supervised by Prof. Xiangyu Zhao. Before that, I graduated from Zhejiang University (ZJU) with a bachelor’s degree in Geographic Information Science and from The University of Hong Kong (HKU) with a master’s degree in Computer Science. My research interest includes Recommender System, Information Retrieval, Large Language Models, and GeoAI.

🔥 News

2026.04: Three papers are accepted to SIGIR'26, congrats to Derong, Xiaopeng, and Ziwei!
2026.04: Our tutorial on Personalized RAG and Agent is accepted to SIGIR'26!
2026.01: Two papers are accepted to ICLR'26, congrats to Yingyi and Derong!
2026.01: Two papers are accepted to WWW'26, congrats to Xiaopeng and Wenlin!
2025.12: Our Survey on Personalized RAG and Agent is accepted to TOIS'26, congrats to Xiaopeng!
2025.11: One paper is accepeted to KDD'26, congrats to Wenlin!
2025.11: Four papers are accepted to AAAI'26, congrats to Yingyi, Yuxuan, Maolin, and Dayan!
2025.09: Our paper GeoRanker and ReasonRAG are accepted to NeurIPS'25!
2025.08: I'm honored to received the Outstanding Academic Performance Award (OAPA) granted by CityU HK.
2025.08: Our paper SELF, Scenario-Wise Rec Benchmark, and UserIP-Tuning have been accepted to CIKM'25!
2025.07: Our paper Agent4Ranking has been accepted to TOIS, congrats to Xiaopeng!
2025.06: 🌍GeoArena has been launched! Your feedback matters!
2025.05: Our paper RADIO and SEED are accepted to ACL'25.
2025.05: Two papers are accepted to KDD'25!
2025.05: Our tutorial and survey for LLM Enhanced Recommender System got accepted to KDD'2025!
2025.04: One paper got accepted to SIGIR'25.
2025.03: I arrive in Madison and start my visiting life!
2025.02: Our Workshop on AgentIR is accepted to SIGIR'25! We welcome submissions and appreciate your attention.
2024.12: Our paper TAPO is accepted to ICASSP'25!
2024.12: One paper is accepted to AAAI'25!
2024.12: Two tutorials are accepted by WWW'25! See Joint Modeling in Deep Recommender Systems and Web-Centric Human Mobility Analytics: Methods, Applications, and Future Directions in the LLM Era
2024.10: I'm Glad to receive the NeurIPS 2024 Scholar Award!
2024.09: Our paper G3 is accepted to NeurIPS'24!
2024.09: Recieving Outstanding Academic Performance Award (OAPA) from CityUHK.
2024.07: Giving a talk on LLM for Query Expansion in IR at DataFun.
2024.07: Our team AML_Lab@CityU got second place🥈 in 2 tracks, third place 🥉 in 3 tracks, and student award in 2 tracks, Overall 2/508, and is awarded $8750 in Amazon KDD CUP 2024! A big shoutout to the awesome teamwork with my teammates Jingtong, Xiaopeng, Zixuan, and Yiyao!
2024.07: I'm honored to receive the KDD'24 student travel award.
2024.05: Our paper ERASE got accepted by KDD'24 ADS Track.
2024.05: I am honored to be selected as a virtual volunteer for NAACL'2024.
2024.03: I will serve as the PC member in CIKM'24.
2024.03: Our paper MILL got accepted by NAACL'2024 (Main Conference)
2024.03: Passed my qualifying examination!
2023.12: I am honored to receive the AAAI'24 student scholarship
2023.12: Accepted as reviewer of ACM Transactions on Knowledge Discovery from Data (ACM TKDD)
2023.12: One paper accepted by AAAI'24
2023.08: I will serve as the PC member in AAAI'24
2023.04: Our tutorial on Joint Modeling in Recommendations is accepted by IJCAI'23
2023.01: Start my PhD study at CityU.

📝 Publications

Conference and Journal Publications

“†” denotes equal contributions, “*” denotes corresponding authors

Selected Publications

GeoRouter: Dynamic Paradigm Routing for Worldwide Image Geolocalization
Pengyue Jia, Derong Xu, Yingyi Zhang, Xiaopeng Li, Wenlin Zhang, Yi Wen, Yuanshao Zhu, Xiangyu Zhao
arxiv | Paper
Personalize Before Retrieve: LLM-based Personalized Query Expansion for User-Centric Retrieval
Yingyi Zhang†, Pengyue Jia†, Derong Xu, Yi Wen, Xianneng Li, Yichao Wang, Wenlin Zhang, Xiaopeng Li, Weinan Gan, Huifeng Guo, Yong Liu, Xiangyu Zhao
AAAI’26 Oral | Paper | Github |
Emotion and Intention Guided Multi-Modal Learning for Sticker Response Selection
Yuxuan Hu, Jian Chen, Yuhao Wang, Zixuan Li, Jing Xiong, Pengyue Jia*, Wei Wang, Chengming Li, Xiangyu Zhao*
AAAI’26 | Github |
GeoArena: An Open Platform for Benchmarking Large Vision-language Models on WorldWide Image Geolocalization
Pengyue Jia†, Yingyi Zhang†, Xiangyu Zhao, Yixuan Li
arxiv | Paper | Github |
Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation
Derong Xu†, Pengyue Jia†, Xiaopeng Li, Yingyi Zhang, Maolin Wang, Qidong Liu, Xiangyu Zhao, Yichao Wang, Huifeng Guo, Ruiming Tang, Enhong Chen, Tong Xu
arxiv | Paper
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization
Pengyue Jia, Seongheon Park, Song Gao, Xiangyu Zhao, Yixuan Li
NeurIPS’25 | Paper | Github |
LSRP: A Leader-Subordinate Retrieval Framework for Privacy-Preserving Cloud-Device Collaboration
Yingyi Zhang†, Pengyue Jia†, Xianneng Li, Derong Xu, Maolin Wang, Yichao Wang, Zhaocheng Du, Huifeng Guo, Yong Liu, Ruiming Tang, Xiangyu Zhao
KDD’25 | Paper | Github |
A Survey of Personalization: From RAG to Agent
Xiaopeng Li†, Pengyue Jia†, Derong Xu, Yi Wen, Yingyi Zhang, Wenlin Zhang, Wanyu Wang, Yichao Wang, Zhaocheng Du, Xiangyang Li, Yong Liu, Huifeng Guo, Ruiming Tang, Xiangyu Zhao
TOIS’26 | Paper | Github |
Bridging Relevance and Reasoning: Rationale Distillation in Retrieval-Augmented Generation
Pengyue Jia†, Derong Xu†, Xiaopeng Li†, Zhaocheng Du, Xiangyang Li, Xiangyu Zhao, Yichao Wang, Yuhao Wang, Huifeng Guo, Ruiming Tang
ACL’25 Findings | Paper | Code | Dataset |
SELF: Surrogate-light Feature Selection with Large Language Models in Deep Recommender Systems
Pengyue Jia, Zhaocheng Du, Yichao Wang, Xiaopeng Li, Yuhao Wang, Qidong Liu, Huifeng Guo, Ruiming Tang, Xiangyu Zhao
CIKM’25
Second Place Overall Solution for Amazon KDD Cup 2024
Pengyue Jia†, Jingtong Gao†, Xiaopeng Li†, Zixuan Wang†, Yiyao Jin†, Xiangyu Zhao
KDD Cup Workshop Oral | Competition Page | Workshop Page | Paper | Certificate
G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models
Pengyue Jia, Yiding Liu, Xiaopeng Li, Xiangyu Zhao, Yuhao Wang, Yantong Du, Xiao Han, Xuetao Wei, Shuaiqiang Wang, Dawei Yin
NeurIPS’24 | Paper | Code | MP16-Pro Dataset (5000+ downloads) |
ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems
Pengyue Jia†, Yejing Wang†, Zhaocheng Du†, Xiangyu Zhao, Yichao Wang, Bo Chen, Wanyu Wang, Huifeng Guo, Ruiming Tang
KDD’24 | Home Page | Paper | Code | Dataset |
D3: A Methodological Exploration of Domain Division, Modeling, and Balance in Multi-Domain Recommendations
Pengyue Jia, Yichao Wang, Xiangyu Zhao, Xiaopeng Li, Huifeng Guo, Ruiming Tang
AAAI’24 | Deployed in the production environment with 100% traffic.
MILL: Mutual Verification with Large Language Models for Zero-Shot Query Expansion
Pengyue Jia, Yiding Liu, Xiangyu Zhao, Xiaopeng Li, Changying Hao, Shuaiqiang Wang, Dawei Yin
NAACL’24 Main | Home Page | Paper | Code | Dataset |
Fine-Grained Population Mobility Data-Based Community-Level COVID-19 Prediction Model
Pengyue Jia, Ling Chen, Dandan Lyu
Cybernetics and Systems

Other Work

20. ProEchoMem: Enhancing Long Video Understanding via Multi-Trace Probe-Echo Memory, Derong Xu, Yanxin Chen, Wanyu Wang, Pengyue Jia, Chao Zhang, Maolin Wang, Yiqi Wang, Jipeng Qiang, Xuetao Wei, Hongzhi Yin, Tong Xu, Xiangyu Zhao, SIGIR'26.
19. LLM-EDT: Large Language Models Enhanced Cross-domain Sequential Recommendation with Dual-phase Training, Ziwei Liu, Qidong Liu, Wanyu Wang, Yejing Wang, Pengyue Jia, Tong Xu, WEI HUANG, Chong Chen, Xiangyu Zhao, SIGIR'26.
18. Personalized Deep Research: A User‑Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery, Xiaopeng Li, Wenlin Zhang, Yingyi Zhang, Pengyue Jia, Yejing Wang, Yichao Wang, Yong Liu, Huifeng Guo and Xiangyu Zhao, SIGIR'26 Resource Track.
17. From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents, Derong Xu, Yi Wen, Pengyue Jia, Yingyi Zhang, Wenlin Zhang, Yichao Wang, Huifeng Guo, Ruiming Tang, Xiangyu Zhao, Enhong Chen, Tong Xu, ICLR'26.
16. Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval, Yingyi Zhang, Junyi Li, Wenlin Zhang, Pengyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu Zhao, ICLR'26.
15. To Search or Not to Search: Aligning the Decision Boundary of Deep Search Agents via Causal Intervention, Wenlin Zhang, Kuicai Dong, Junyi Li, Yingyi Zhang, Xiaopeng Li, Pengyue Jia, Yi Wen, Derong Xu, Maolin Wang, Yichao Wang, Yong Liu and Xiangyu Zhao, WWW'26.
14. BlossomRec: Block-level Fused Sparse Attention Mechanism for Sequential Recommendations, Mengyang Ma, Xiaopeng Li, Wanyu Wang, Zhaocheng Du, Jingtong Gao, Pengyue Jia, Yuyang Ye, Yiqi Wang, Yunpeng Weng, Weihong Luo, Xiao Han and Xiangyu Zhao, WWW'26.
13. Exploring Recommender System Evaluation: A Multi-Modal LLM Agent Framework for A/B Testing, wenlin zhang, Xiangyang Li, Qiyuan Ge, Kuicai Dong, Pengyue Jia, Xiaopeng Li, Zijian Zhang, Maolin Wang, Yichao Wang, Huifeng Guo, Ruiming Tang, Xiangyu Zhao, KDD'26.
12. Renormalization Group Guided Tensor Network Structure Search, Maolin Wang, YU Bowen, Sheng Zhang, Linjie Mi, Wanyu Wang, Yiqi Wang, Pengyue Jia, Xuetao Wei, Zenglin Xu, Ruocheng Guo, Xiangyu Zhao,AAAI'26.
11. RoSA: Enhancing Parameter-Efficient Fine-Tuning via RoPE-aware Selective Adaptation in Large Language Models, Dayan Pan, Jingyuan Wang, Yilong Zhou, Jiawei Cheng, Pengyue Jia, Xiangyu Zhao,AAAI'26.
10. Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning, wenlin zhang, Xiangyang Li, Kuicai Dong, Yichao Wang, Pengyue Jia, Xiaopeng Li, Yingyi Zhang, Derong Xu, Zhaocheng Du, Huifeng Guo, Ruiming Tang, Xiangyu Zhao, NeurIPS'25.
9. Prompt Tuning as User Inherent Profile Inference Machine, Yusheng Lu, Zhaocheng Du, Xiangyang Li, Pengyue Jia, Yejing Wang, Weiwen Liu, Yichao Wang, Huifeng Guo, Ruiming Tang, Zhenhua Dong, Yongrui Duan and Xiangyu Zhao, CIKM'25 (Applied Research Track).
8. Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark, Xiaopeng Li, Jingtong Gao, Pengyue Jia, Xiangyu Zhao, Yichao Wang, Wanyu Wang, Yejing Wang, Yuhao Wang, Huifeng Guo, Ruiming Tang, CIKM'25.
7. Agent4ranking: Semantic robust ranking via personalized query rewriting using multi-agent llm, Xiaopeng Li, Lixin Su, Pengyue Jia, Xiangyu Zhao, Suqi Cheng, Junfeng Wang, Dawei Yin, TOIS.
6. Stepwise Reasoning Error Disruption Attack of LLMs, Jingyu Peng, Maolin Wang, Xiangyu Zhao, Kai Zhang, Wanyu Wang, Pengyue Jia, Qidong Liu, Ruocheng Guo, Qi Liu, ACL'25 Main.
5. Measure Domain's Gap: A Similar Domain Selection Principle for Multi-Domain Recommendation, Yi Wen, Yue Liu, Derong Xu, Huishi Luo, Pengyue Jia, Yiqing Wu, Siwei Wang, Ke Liang, Maolin Wang, Yiqi Wang, Fuzhen Zhuang, Xiangyu Zhao, KDD'25.
4. Large Language Model Enhanced Recommender Systems: A Survey, Qidong Liu, Xiangyu Zhao, Yuhao Wang, Yejing Wang, Zijian Zhang, Yuqi Sun, Xiang Li, Maolin Wang, Pengyue Jia, Chong Chen, Wei Huang, Feng Tian, KDD'25.
3. Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models, Yuhao Wang, Junwei Pan, Xiangyu Zhao, Pengyue Jia, Wanyu Wang, Yuan Wang, Yue Liu, Dapeng Liu, Jie Jiang, SIGIR'25.
2. TAPO: TASK-REFERENCED ADAPTATION FOR PROMPT OPTIMIZATION, Wenxin Luo*, Weirui Wang*, Xiaopeng Li*, Weibo Zhou, Pengyue Jia, Xiangyu Zhao, ICASSP'25.
1. SIGMA: Selective Gated Mamba for Sequential Recommendation, Ziwei Liu, Qidong Liu, Yejing Wang, Wanyu Wang, Pengyue Jia, Maolin Wang, Zitao Liu, Yi Chang, Xiangyu Zhao, AAAI'25.

Tutorials and Workshops

SIGIR'2026

Bridging Personalization and AI: From RAG to Agent

Pengyue Jia†, Xiaopeng Li†, Derong Xu, Yi Wen, Yingyi Zhang, Wenlin Zhang, Wanyu Wang, Yichao Wang, Yong Liu and Xiangyu Zhao

KDD'2025

Large Language Model Enhanced Recommender Systems-Methods, Applications and Trends

Qidong Liu, Xiangyu Zhao, Yuhao Wang, Yejing Wang, Zijian Zhang, Yuqi Sun, Xiang Li, Maolin Wang, Pengyue Jia, Chong Chen, Wei Huang, Feng Tian

Home Page | Github

SIGIR'2025

AgentIR: 2nd Workshop on Agent-based Information Retrieval

Pengyue Jia, Qingpeng Cai, Xiangyu Zhao, Ling Pan, Xin Xin, Jin Huang, Weinan Zhang, Li Zhao, Dawei Yin, Grace Hui Yang

Home Page

WWW'2025

Joint Modeling in Deep Recommender Systems

Pengyue Jia, Jingtong Gao, Yejing Wang, Yuhao Wang, Xiaopeng Li, Qidong Liu, Yichao Wang, Bo Chen, Huifeng Guo, Ruiming Tang

Home Page | Slides

WWW'2025

Web-Centric Human Mobility Analytics: Methods, Applications, and Future Directions in the LLM Era

Zijian Zhang, Hao Miao, Yuxuan Liang, Yan Zhao, Xiao Han, Pengyue Jia, Bin Yang and Christian S. Jensen

IJCAI'2023

Joint Modeling in Recommendations: Foundations and Frontiers

Xiangyu Zhao, Yichao Wang, Bo Chen, Pengyue Jia, Yuhao Wang, Jingtong Gao, Huifeng Guo, Ruiming Tang

🎖 Honors and Awards

2025.08 Outstanding Academic Performance Award (OAPA), Granted by CityUHK
2024.10 NeurIPS 2024 Scholar Award, Granted by NeurIPS 2024
2024.08 Outstanding Academic Performance Award (OAPA), Granted by CityUHK
2024.07 Second place🥈 in 2 tracks, third place🥉 in 3 tracks, student awards in 2 tracks in Amazon KDD CUP 2024, Overall 2/508 teams, Awarded $8750, Granted by Amazon [link] | [certificate]
2024.07 KDD24 student travel award, Granted by KDD
2023.12 AAAI24 student scholarship, Granted by AAAI
2020.12 Academic Excellence Award, Granted by Zhejiang University
2020.06 Second Place🥈 in LA COVID-19 Computational Challenge, Granted by RMDS & The Government of LA

📖 Educations

2025.03 - 2025.10, Visiting PhD Student in Computer Science, University of Wisconsin-Madison, supervised by Prof. Sharon Li.
2023.01 - now, PhD candidate in Data Science, AML lab, City University of Hong Kong, supervised by Prof. Xiangyu Zhao.
2021.09 - 2022.12, MSc in Computer Science, The University of Hong Kong
2017.09 - 2021.06, BSc in Geographic Information Science, Zhejiang University

💬 Invited Talks

2024.07, DataFun Open Class, LLM for Query Expansion in IR
2020.11, IM Data 2020, Solution on LA COVID-19 Computational Challenge

💻 Internships & Exchange

2025.10 - now, Research Intern, Kuaishou Technology, Beijing, China
2023.06 - 2025.07, Research Intern, Baidu Search Science Team, Beijing, China
2022.06 - 2022.12, Ad Recommendation Algorithm Intern, Meituan DaoDian Business Group, Shanghai, China.
2020.10 - 2021.01, Data Analysis Intern, Zhejiang Lab, Hangzhou, China.
2019.07 - 2019.08, Summer Session Student, Department of Geography & Geographic Information Science, University of Illinois Urbana-Champaign, USA.
2018.07 - 2018.08, Summer Session Student, Shizuoka University, Japan.

✏️ Services

Reviewer

2024: KDD, ACM TKDD, CIKM
2025: KDD, WWW, ARR, NeurIPS, ACM TKDD
2026: AAAI, ICLR, CVPR, ICML, ARR, SIGIR, ACM TKDD

Volunteer

2024: AAAI, NAACL, KDD [certificate]
2025: WWW, ACL, NeurIPS

🏫 Teaching

2026.01 - 2026.06, Teaching Assistant, SDSC 6001 Statistical Machine Learning II.
2025.01 - 2025.06, Teaching Assistant, SDSC 6001 Statistical Machine Learning II.
2024.09 - 2024.12, Teaching Assistant, SDSC 5001 Statistical Machine Learning I.
2024.01 - 2024.06, Teaching Assistant, SDSC 6001 Statistical Machine Learning II.
2023.09 - 2023.12, Teaching Assistant, SDSC 5001 Statistical Machine Learning I.

Pengyue Jia

贾鹏越