李佳坤, 刘艳青, 杜方, 余振华, 冯宇, 王慧, 霍显浩
录用日期: 2025-09-25
针对通用医学大模型在脑肿瘤领域存在的专业数据匮乏、临床适应性不足及生成内容准确性有限等问题,提出了一种专用于脑肿瘤诊疗领域的大型语言模型BrainTumorLLM。该模型基于Meta-Llama-3-8B-Instruct模型,通过监督微调(Supervised Fine-tuning,SFT)和人类反馈强化学习(Reinforcement Learning with Human Feedback,RLHF)技术优化,结合自建的高质量脑肿瘤问答数据集BrainTumorQA进行训练。数据集采用宏观-微观协同的构建框架,共包含11,000条问答对,涵盖宏观医学知识(症状、诊断方法、治疗方案)及微观临床病例(1252份真实脑肿瘤MRI报告),并通过脱敏处理与信息约束策略保障数据安全。技术实现中,采用低秩适配(Low-Rank Adaptation,LoRA)技术提升训练效率,设计宏观与微观两级提示模板引导模型生成专业化回答,并引入人类反馈学习,通过专家偏好驱动优化机制以及近端策略优化(Proximal Policy Optimization,PPO)算法强化生成内容的临床一致性。实验结果表明,BrainTumorLLM在脑肿瘤问答任务中显著优于通用及医学领域模型,在自动评估环节,其BLUE-1、BLUE-2上分别达到了0.3383和0.2684,ROUGE-1、ROUGE-2和ROUGE-L得分分别为0.3237、0.1466和0.2611,与较基底模型相比困惑度从20.362大幅降至7.674,充分显示了该模型在脑肿瘤诊疗领域的专业性、精准性及临床应用潜力,为脑肿瘤的诊断、治疗决策以及医学科研等工作提供有力的智能化辅助支持。