开展AI相关研究,撰写论文时要注意的10点

9天前 来源:医咖会

本文整理自《Radiology》期刊(IF=12.1)在2025年2月发表的一篇专家述评文章,对于放射科医生撰写AI相关研究论文提出了10个tips,这些tips对于任何AI论文写作者都具有参考价值。

2017年的一次会议上,有位专家提出了一个发人深省的问题:"人工智能(AI)会取代医生吗?"。他随即给出了答案:"我的回答是否定的,但使用AI的医生必将取代那些拒绝AI的同行"。

如今《Radiology》期刊约三分之一的论文都以AI为核心议题,关于大语言模型和生成式AI(如ChatGPT)的研究文章尤为热门。这意味着临床医生不仅需要掌握AI应用技能,还应学会如何撰写AI相关的论文(期刊编辑亦然)。

1. 撰写AI相关论文前,请查阅相关的《人工智能研究报告规范》

在《Radiology》期刊发表AI相关论文时,需特别注意2024版《医学影像人工智能检查清单指南(CLAIM)》的两项术语更新[1]:

• 使用"reference standard"替代"ground truth"或"gold standard"

• CLAIM专家组建议避免使用"validation"一词,推荐采用"model optimization"或" tuning"等表述

2. 详述所有数据集并附上数据集特征表与流程图

在"材料与方法"部分,请按以下顺序描述数据集:训练集(training set)、验证集(validation set)、内部测试集(internal test set)和外部测试集(external test set)[1,2]。需特别说明的是,验证集可能有多种命名方式,例如调优集(tuning set)或开发集(development set)。根据CLAIM指南要求,应避免使用"验证集"这一术语,而是描述"用于模型优化的数据",可使用术语“tuning”[1]。

在"结果"部分的开篇,需包含

数据集的特征表:展示人群的人口统计学特征,用于评估模型训练人群能否代表其应用的目标人群。若训练数据缺乏关键预测因素(如年龄、性别等),模型将无法有效预测结局。

流程图:以可视化形式呈现各数据集样本量及筛选过程。

3. 详细描述模型的训练方法

为确保最佳性能,训练模型时应使用该领域内广泛认可且可合理获取的高质量数据。例如,优先选择技术先进的影像学检查结果、病理结果或长期随访影像和结局数据,而非普通放射学报告[2]。

训练过程

1.需详细描述训练流程与超参数(Hyperparameter),确保实验可复现。

2.若字数受限,可通过标准化框架的简明训练脚本代码呈现细节。

模型选择

  • 明确说明在测试前从所有训练模型中筛选出最优模型的方法与评估指标。
  • 若提供多个模型,需逐一说明合理性。

4. 说明内部测试与外部测试的实施方法

内部测试指采用训练数据中预留的子集(即内部测试集)进行验证的过程,而外部测试应使用来自其他机构的影像数据(即外部测试集)。若未进行外部测试,须明确说明并讨论该局限性

5. 避免在指代测试或测试集时使用"验证(validation) "一词

机器学习术语"validation"易导致医疗专业人员误解,可能被理解为检验模型是否"有效",而健康研究报告规范(如EQUATOR网络指南)在医学文献中使用的"验证"定义与此存在差异。

因此,《Radiology》期刊不鼓励使用"验证(validation)"一词,除非特指验证集(用于模型调优的数据集)。不要使用"验证(validation)"来指代模型的测试或测试集。

评论
请先登录后再发表评论
发表评论
0
Scan me!
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
工具权益
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
工具权益
200积分
确认
取消
APP下载 NEW
扫码下载APP
2张课程券
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈