Comparative analysis of large language models on rare disease identification

Guangyu Ao; Min Chen; Jing Li; Lei Zhang; Zejun Chen

doi:10.1186/s13023-025-03656-w

RDLNetworkEcosystem

About FAQ

About FAQ Privacy Terms Contact

Comparative analysis of large language models on rare disease identification — Guangyu Ao (2025) | RDL Network

Back

Home
Publications
Comparative analysis of large language models on rare disease identification

Shared by

Lei Zhang

Comparative analysis of large language models on rare disease identification

Letter 2025 en

Authors

GA
Guangyu Ao
MC
Min Chen
JL
Jing Li

Abstract

1 min read

Diagnosing rare diseases is challenging due to their low prevalence, diverse presentations, and limited recognition, often leading to diagnostic delays and errors. This study evaluates the effectiveness of multiple large language models (LLMs) in identifying rare diseases, comparing their performance with that of human physicians using real clinical cases. We analyzed 152 rare disease cases from the Chinese Medical Case Repository using four LLMs: ChatGPT-4o, Claude 3.5 Sonnet, Gemini Advanced, and Llama 3.1 405B. Overall, the LLMs performed better than human physicians, and Claude 3.5 Sonnet achieved the highest accuracy at 78.9%, significantly surpassing the accuracy of human physicians, which was 26.3%. These findings suggest that LLMs can improve rare disease diagnosis and serve as valuable tools in clinical settings, particularly in regions with limited resources. However, further validation and careful consideration of ethical and privacy issues are necessary for their effective integration into medical practice.

Discussion(0)

No comments yet. Be the first to comment.

Publication Info

DOI: 10.1186/s13023-025-03656-w
Year: 2025
Published: —
Language: en

Letter Details

Volume: 20
Issue: 1
Link Of The Paper: https://doi.org/10.1186/s13023-025-03656-w

Timeline

Created:June 19, 2026

Related publications

Preprint2025

Optimizing Model Selection for Compound AI Systems

Lingjiao Chen, Jared Quincy Davis, Boris Hanin, Peter Bailis, Matei Zaharia, James Zou, Ion Stoica

Preprint2024

Comparison of LLMs in Extracting Synthesis Conditions and Generating Q&amp;A Datasets for Metal-Organic Frameworks

Yuang Shi, Nakul Rampal, Chengbin Zhao, Christian Borgs, Jennifer Chayes, Omar M Yaghi

Preprint2024

Benchmarking Human-AI Collaboration for Common Evidence Appraisal Tools

Tim Woelfle, Julian Hirt, Perrine Janiaud, Ludwig Kappos, John P A Ioannidis, Lars G. Hemkens

Preprint2025

AndesVL Technical Report: An Efficient Mobile-side Multimodal Large Language Model

Quanlong Zheng, Yanhao Zhang, Hongmei Ji, Jian Ma, Zhitong Zheng, Zhenyi Lin, Hongxia Deng, Xin Zou, Xiaojie Yin, Ran Wang, Liang Cai, Haijing Liu, Yuqing Qiu, Ke Chen, Zheng Li, Chi Xie, Huafei Li, Chenxing Li, Chuangchuang Wang, Kai Tang, Zhiguang Zhu, Weijun Gao, Rui Wang, Jun Wu, Chao Liu,

Preprint2024

Are large language models superhuman chemists?

Adrian Mirza, Nawaf Alampara, Sreekanth Kunchapu, Benedict Emoekabu, Aswanth Krishnan, Tanya Gupta, Macjonathan Okereke, Amir Mohammad Elahi, Mehrdad Asgari, J. Eberhardt, Maximilian Greiner, Caroline T. Holick, Christina Glaubitz, Tim Hoffmann, Lea C. Klepsch, Yannik Köster, Fabian Alexander Kreth, Jakob Meyer, Santiago Miret, Michael Ringleb, Nicole C. Roesner, Ulrich Sigmar Schubert, Leanne M. Stafast, Dinga Wonanke, Michael Pieler,

Qin Xie,

Chen Chen,

Haonan Lu,

Zhou Jin,

Xiaohui Song,

Nan Wang,

Yafei Liu,

Chao Li,

Xin Li,

Ruichen Wang,

Zhihao Li,

Qi Qi,

Long Cheng,

Dongze Hao

Philippe Schwaller,

Kevin Maik Jablonka

Comparative analysis of large language models on rare disease identification

Abstract

Discussion(0)

Related publications

Optimizing Model Selection for Compound AI Systems

Comparison of LLMs in Extracting Synthesis Conditions and Generating Q&amp;amp;A Datasets for Metal-Organic Frameworks

Benchmarking Human-AI Collaboration for Common Evidence Appraisal Tools

AndesVL Technical Report: An Efficient Mobile-side Multimodal Large Language Model

Are large language models superhuman chemists?

Comparison of LLMs in Extracting Synthesis Conditions and Generating Q&A Datasets for Metal-Organic Frameworks