Publications

Group highlights

At the end of this page, you can find the full list of publications.

Truth, Trust, and Trouble: Medical AI on the Edge

Mohammad Anas Azeez, Rafiq Ali, Ebad Shabbir, Zohaib Hasan Siddiqui, Gautam Siddharth Kashyap, Jiechao Gao, Usman Naseem

2025

EMNLP Industry Track

LLMs on a Budget? Say HOLA

Zohaib Hasan Siddiqui, Jiechao Gao, Ebad Shabbir, Mohammad Anas Azeez, Rafiq Ali Gautam Siddharth Kashyap, Usman Naseem

2025

EMNLP Industry Track

PersoPilot: An Adaptive AI-Copilot for Transparent Contextualized Persona Classification and Personalized Response Generation

Saleh Afzoon, Amin Beheshti, and Usman Naseem

2025

IEEE International Conference on Data Mining (ICDM), Demo Track

PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims

Yongmin Yoo (*MQ PhD), Qiongkai Xu, Longbing Cao

2025

EMNLP

GRADA: Graph-based Reranker against Adversarial Documents Attack

Jingjie Zheng, Aryo Pradipta Gema, Giwon Hong, Xuanli He, Pasquale Minervini, Youcheng Sun, Qiongkai Xu

2025

EMNLP

Cut the Deadwood Out: Post-Training Model Purification with Selective Module Substitution

Yao Tong, Weijun Li, Xuanli He, Haolan Zhan, Qiongkai Xu

2025

EMNLP

NAP^2: A Benchmark for Naturalness and Privacy-Preserving Text Rewriting by Learning from Human

Shuo Huang, William Maclean, Xiaoxi Kang, Qiongkai Xu, Zhuang Li, Xingliang Yuan, Gholamreza Haffari, Lizhen Qu

2025

EMNLP

Can LLM Agents Maintain a Persona in Discourse?

Pranav Bhandari, Nicolas Fay, Michael J Wise, Amitava Datta, Stephanie Meek, Usman Naseem, Mehwish Nasim

2025

EMNLP

Benchmarking Large Language Models for Cryptanalysis and Side-Channel Vulnerabilities

Utsav Maskey, Chencheng ZHU, Usman Naseem

2025

EMNLP

TurnBench-MS: A Benchmark for Evaluating Multi-Turn, Multi-Step Reasoning in Large Language Models

Yiran Zhang, Mo Wang, Xiaoyang Li, Kaixuan Ren, Chencheng ZHU, Usman Naseem

2025

EMNLP

Too Helpful, Too Harmless, Too Honest or Just Right?

Gautam Siddharth Kashyap, Mark Dras, Usman Naseem

2025

EMNLP

Pluralistic Alignment for Healthcare: A Role-Driven Framework

Jiayou Zhong, Anudeex Shetty, Chao Jia, Xuanrui Lin, Usman Naseem

2025

EMNLP

ExtremeAIGC: Benchmarking LMM Vulnerability to AI-Generated Extremist Content

Bhavik Chandna, Mariam Aboujenane, Usman Naseem

2025

EMNLP

From Generation to Detection: A Multimodal Multi-Task Dataset for Benchmarking Health Misinformation

Zhihao Zhang, Yiran Zhang (MQ MRes), Xiyue Zhou, Liting Huang, Imran Razzak, Preslav Nakov, Usman Naseem

2025

EMNLP

A Systematic Literature Review on Multimodal Text Summarization

Abid Ali, Diego Molla-Aliod

2025

ACM Computing Surveys

Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation

Shuchang Ye, Usman Naseem, Mingyuan Meng, Jinman Kim

2025

ICCV

ALGEN: Few-shot Inversion Attacks on Textual Embeddings using Alignment and Generation

Yiyi Chen, Qiongkai Xu, Johannes Bjerva

2025

ACL

WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks

Anudeex Shetty, Qiongkai Xu, Jey Han Lau

2025

ACL

TUBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning

Xuanli He, Jun Wang, Qiongkai Xu, Pasquale Minervini, Pontus Stenetorp, Benjamin I. P. Rubinstein, Trevor Cohn

2025

ACL

VITAL: A New Dataset for Benchmarking Pluralistic Alignment in Healthcare

Anudeex Shetty, Amin Beheshti, Mark Dras, Usman Naseem

2025

ACL

Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-up

Jiahao Yuan, Dehui du, Hao Zhang, Zixiang Di, Usman Naseem

2025

ACL

ReflectDiffu: Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework

Jiahao Yuan, Zixiang Di, Zhiqing Cui, Guisong Yang, Usman Naseem

2025

ACL

Full List of publications

Truth, Trust, and Trouble: Medical AI on the Edge
Mohammad Anas Azeez, Rafiq Ali, Ebad Shabbir, Zohaib Hasan Siddiqui, Gautam Siddharth Kashyap, Jiechao Gao, Usman Naseem
2025
EMNLP Industry Track

LLMs on a Budget? Say HOLA
Zohaib Hasan Siddiqui, Jiechao Gao, Ebad Shabbir, Mohammad Anas Azeez, Rafiq Ali Gautam Siddharth Kashyap, Usman Naseem
2025
EMNLP Industry Track

PersoPilot: An Adaptive AI-Copilot for Transparent Contextualized Persona Classification and Personalized Response Generation
Saleh Afzoon, Amin Beheshti, and Usman Naseem
2025
IEEE International Conference on Data Mining (ICDM), Demo Track

PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims
Yongmin Yoo (*MQ PhD), Qiongkai Xu, Longbing Cao
2025
EMNLP

GRADA: Graph-based Reranker against Adversarial Documents Attack
Jingjie Zheng, Aryo Pradipta Gema, Giwon Hong, Xuanli He, Pasquale Minervini, Youcheng Sun, Qiongkai Xu
2025
EMNLP

Cut the Deadwood Out: Post-Training Model Purification with Selective Module Substitution
Yao Tong, Weijun Li, Xuanli He, Haolan Zhan, Qiongkai Xu
2025
EMNLP

NAP^2: A Benchmark for Naturalness and Privacy-Preserving Text Rewriting by Learning from Human
Shuo Huang, William Maclean, Xiaoxi Kang, Qiongkai Xu, Zhuang Li, Xingliang Yuan, Gholamreza Haffari, Lizhen Qu
2025
EMNLP

Can LLM Agents Maintain a Persona in Discourse?
Pranav Bhandari, Nicolas Fay, Michael J Wise, Amitava Datta, Stephanie Meek, Usman Naseem, Mehwish Nasim
2025
EMNLP

Benchmarking Large Language Models for Cryptanalysis and Side-Channel Vulnerabilities
Utsav Maskey, Chencheng ZHU, Usman Naseem
2025
EMNLP

TurnBench-MS: A Benchmark for Evaluating Multi-Turn, Multi-Step Reasoning in Large Language Models
Yiran Zhang, Mo Wang, Xiaoyang Li, Kaixuan Ren, Chencheng ZHU, Usman Naseem
2025
EMNLP

Too Helpful, Too Harmless, Too Honest or Just Right?
Gautam Siddharth Kashyap, Mark Dras, Usman Naseem
2025
EMNLP

Pluralistic Alignment for Healthcare: A Role-Driven Framework
Jiayou Zhong, Anudeex Shetty, Chao Jia, Xuanrui Lin, Usman Naseem
2025
EMNLP

ExtremeAIGC: Benchmarking LMM Vulnerability to AI-Generated Extremist Content
Bhavik Chandna, Mariam Aboujenane, Usman Naseem
2025
EMNLP

From Generation to Detection: A Multimodal Multi-Task Dataset for Benchmarking Health Misinformation
Zhihao Zhang, Yiran Zhang (MQ MRes), Xiyue Zhou, Liting Huang, Imran Razzak, Preslav Nakov, Usman Naseem
2025
EMNLP

Steering Towards Fairness: Mitigating Political Stance Bias in LLMs
Afrozah Nadeem, Mark Dras and Usman Naseem
2025
CASE@RANLP

MRGAgents: A Multi-Agent Framework for Improved Medical Report Generation with Med-LVLMs
Pengyu Wang, Shuchang Ye, Usman Naseem, Jinman Kim
2025
DICTA

Enhancing Zero-Shot Learning of Pathology Vision-Language Foundation Models in Tumour Malignancy Recognition
Xiao Wang, Usman Naseem and Jinman Kim
2025
ECAI

Reasoning Large Language Models for Clinical Coding
Akram Mustafa, Usman Naseem, Mostafa Rahimi Azghadi
2025
BioCreative IX @IJCAI

CLARITY: A Lightweight Multimodal Transformer for Harmful Content Detection
Kashyap, Gautam Siddharth *, Niharika Jain, Ebad Shabbir, Harsh Joshi, Usman Naseem, and Jiechao Gao
2025
IEEE Transactions on Artificial Intelligence

UICD: A New Dataset and Approach for Urdu Image Captioning
Rimsha Muzaffar; Syed Yasser Arafat; Junaid Rashid; Jungeun Kim; Usman Naseem
2025
PlosOne

Bi-directional Model Cascading with Proxy Confidence
David Warren *, Mark Dras
2025
ECAI

A Systematic Literature Review on Multimodal Text Summarization
Abid Ali, Diego Molla-Aliod
2025
ACM Computing Surveys

Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation
Shuchang Ye, Usman Naseem, Mingyuan Meng, Jinman Kim
2025
ICCV

Towards Teams being Led by a Conversational Agent
James Simpson, Hamish Stening, Patrick Nalepka, Mark Dras, Rachel W. Kallen, Simon G. Hosking, Deborah Richards, and Michael J. Richardson
2025
ACM Conference on Conversational User Interfaces (CUI )

IDT: Dual-Task Adversarial Rewriting for Attribute Anonymisation
Pedro Faustini, Shakila Mahjabin Tonni, Annabelle McIver, Qiongkai Xu, Mark Dras
2025
Computational Linguistics

AgentMILO: A Knowledge-Based Framework for Complex MILP Modelling Conversations with LLMs
Jyotheesh Gaddam; Lele Zhang; Vicky Mak-Hau; John Yearwood; Bahadorreza Ofoghi; Diego Molla-Aliod
2025
ICCAE

ALGEN: Few-shot Inversion Attacks on Textual Embeddings using Alignment and Generation
Yiyi Chen, Qiongkai Xu, Johannes Bjerva
2025
ACL

WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks
Anudeex Shetty, Qiongkai Xu, Jey Han Lau
2025
ACL

TUBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning
Xuanli He, Jun Wang, Qiongkai Xu, Pasquale Minervini, Pontus Stenetorp, Benjamin I. P. Rubinstein, Trevor Cohn
2025
ACL

VITAL: A New Dataset for Benchmarking Pluralistic Alignment in Healthcare
Anudeex Shetty, Amin Beheshti, Mark Dras, Usman Naseem
2025
ACL

Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-up
Jiahao Yuan, Dehui du, Hao Zhang, Zixiang Di, Usman Naseem
2025
ACL

ReflectDiffu: Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework
Jiahao Yuan, Zixiang Di, Zhiqing Cui, Guisong Yang, Usman Naseem
2025
ACL

A Multimodal Prompt-based Framework for Analyzing Code-Mixed and Low-Resource Memes
Surendrabikram Thapa, Hariram Veeramani, Liang Hu, Qi Zhang, Wei Wang, Usman Naseem
2025
AAAI ICWSM

Myanmar XNLI: Building a Dataset and Exploring Low-resource Approaches to Natural Language Inference with Myanmar
Aung Kyaw Htet, Mark Dras
2025
Language Resources and Evaluation

Towards a Bipartisan Understanding of Peace and Vicarious Interactions
Arka Dutta, Syed Mohammad Sualeh Ali, Usman Naseem, Ashiqur R. KhudaBukhsh
2025
IJCAI

Negotiation Games with Structured Post-hoc Intents.
David Warren, Mark Dras, Malcolm Ryan
2025
Pattern Recognition Letters

Graded Suspiciousness of Adversarial Texts to Humans
Shakila Mahjabin Tonni, Pedro Faustini, Mark Dras
2025
Computational Linguistics

Expert evaluation of large language models for clinical dialogue summarization
David Fraile Navarro, Enrico Coiera, Thomas W Hambly, Zoe Triplett, Nahyan Asif, Anindya Susanto, Anamika Chowdhury, Amaya Azcoaga Lorenzo, Mark Dras, Shlomo Berkovsky
2025
Scientific Reports

Proceedings of the 31st International Conference on Computational Linguistics: System Demonstrations
Owen Rambow, Leo Wanner, Marianna Apidianaki, Hend Al-Khalifa, Barbara Di Eugenio, Steven Schockaert, Brodie Mather, Mark Dras
2025
Proceedings of the 31st International Conference on Computational Linguistics System Demonstrations

Natural Language Understanding of Devanagari Script Languages: Language Identification, Hate Speech and its Target Detection
Surendrabikram Thapa, Kritesh Rauniyar, Farhan Ahmad Jafri, Surabhi Adhikari, Kengatharaiyer Sarveswaran, Bal Krishna Bal, Hariram Veeramani, Usman Naseem
2025
Proceedings of the First Workshop on Challenges in Processing South Asian Languages (CHiPSAL 2025)

Enhancing textual textbook question answering with large language models and retrieval augmented generation
Hessa A. Alawwad, Areej Alhothali, Usman Naseem, Ali Alkhathlan, Amani Jamal
2025
Pattern Recognition

Evaluating Large Language Models on Health-Related Claims Across Arabic Dialects
Abdulsalam obaid Alharbi, Abdullah Alsuhaibani, Abdulrahman Abdullah Alalawi, Usman Naseem, Shoaib Jameel, Salil Kanhere, Imran Razzak
2025
Proceedings of the 1st Workshop on NLP for Languages Using Arabic Script

Knowledge Enhanced Language Model for Biomedical Natural Language Processing: Introducing a New Language Model for BioNLP
Usman Naseem; Qi Zhang; Liang Hu; Sadam Hussain; Shoujin Wang
2025
IEEE Systems, Man, and Cybernetics Magazine

Leveraging Taxonomy and LLMs for Improved Multimodal Hierarchical Classification
Shijing Chen, Mohamed Reda Bouadjenek, Usman Naseem, Basem Suleiman, Shoaib Jameel, Flora Salim, Hakim Hacid, Imran Razzak
2025
Proceedings of the 31st International Conference on Computational Linguistics

Large language models vs human for classifying clinical documents
Akram Mustafa, Usman Naseem, Mostafa Rahimi Azghadi
2025
International Journal of Medical Informatics

BeefBot: Harnessing Advanced LLM and RAG Techniques for Providing Scientific and Technology Solutions to Beef Producers
Zhihao Zhang, Carrie-Ann Wilson, Rachel Hay, Yvette Everingham, Usman Naseem
2025
Proceedings of the 31st International Conference on Computational Linguistics System Demonstrations

Large language models (LLM) in computational social science: prospects, current state, and challenges
Surendrabikram Thapa, Shuvam Shiwakoti, Siddhant Bikram Shah, Surabhi Adhikari, Hariram Veeramani, Mehwish Nasim & Usman Naseem
2025
Social Network Analysis and Mining