申请课题基金时,有必要写研究假设吗?

本文整理自JAMA于2024年1月4日发表的文章“Why Stating Hypotheses in Grant Applications Is Unnecessary”

“本研究假设是,他汀不会增加癌症风险”,这种表述经常出现在基金申请书中,这也是同行、学术机构和资助机构对如何撰写基金申请的常见建议。因此,许多研究者意识到,以假设为导向的研究会受到资助者和评审者的高度重视,因此在申请资助时都会声明研究假设。然而,这种以假设为中心的方法是有问题的。

假设“使用他汀超过10年会致癌”的观点正在社交网络上传播,并引起了极大恐慌,因为很多人会使用他汀来预防心血管疾病。因此,研究者决定调查他汀对癌症的影响,研究者申请经费,以对包含数百万人的临床数据库进行分析。

研究者认为他汀不会致癌,所以在申请基金资助时写下了本文的开头语("本研究假设是,他汀类药物不会增加癌症风险")。然后,研究者开始介绍研究设计和分析。本研究获得了资助,研究者对数据进行分析,并得出以下估计结果:与不服用他汀相比,长期服用他汀10年的癌症风险比为1.01,95%CI为0.99-1.03。

现在想象存在一个平行宇宙,只有一件事有差别:研究者认为他汀会致癌。在平行宇宙中,研究者也申请经费,在经费申请中写道:"本研究假设是他汀会增加癌症风险"。然后,和另一个宇宙一样,研究者描述了同样的研究设计和数据分析,获得资助,并得到同样的结果:与不使用他汀相比,使用他汀的10年癌症风险比为1.01(95%CI 0.99-1.03)。

问题来了:两份申请中描述的两项研究得出了两组相同的结果,不同之处仅在于研究人员对研究假设的表述。在一份申请中,研究者提出的假设是他汀不会致癌,而在另一份申请中,研究者提出的假设是他汀会致癌。假设研究者遵循了既定的研究方案,那么他们最初的假设或猜测其实对结果和结论没有影响。

但是,有人可能会问,如果一开始就没有明确提出假设,我们又如何评价研究是否恰当地检验了假设呢?答案是,一个没有争议的分析目标不是统计假设检验,而是尽可能准确、无偏倚地利用数据估计效应值或关联。假设我们有一个无懈可击的程序,可以仅根据数据就能确定任一因果假设的真假。对于"长期服用他汀不会影响癌症风险"这一假设时,该程序宣布该假设为假。我们是否可以认为工作已经完成,并撰写一篇文章,得出"长期使用他汀会影响癌症风险"的结论?不能。读者会马上问:"使用他汀对癌症风险的影响到底有多大呢?”

与"本研究假设他汀不会增加癌症风险"这种多余的猜测相比,基金申请应该描述研究者提出的问题、为什么要提出这个问题、以及打算如何回答这个问题。有人可能会进一步说,围绕一个假设去设定目标,可能会使研究偏向于支持假设。因此,资助者应要求研究者描述定量的问题,并详细解释为什么回答这个问题很重要,无论定量的答案是什么。

举例来说,我们可以在申请资助时说明,“长期服用他汀会导致癌症”的说法引起了人们的恐慌,需要针对他汀的癌症影响程度进行精准量化,特别是需要将可能的危害与他汀已知益处进行权衡。因此,申请书应具体说明他汀药物的模拟目标试验的方案,该方案可利用现有的观察性数据合理模拟随机试验,并说明模拟流程,统计方法可以用精确度计算取代仅检验1个假设的效能计算。

上述转换改变了将零假设的统计检验作为决策的唯一依据。决策需要考虑很多因素(系统偏倚、危害和益处、成本、可用的行动方案等)以及结果的精确性,由于区间估计显示了与数据高度相容的数值范围,因此结果描述应侧重于区间范围,而不是区间内是否包含零值。在上述例子中,研究者不仅要给出无效假设的P值,还要给出一系列具有临床意义的其他值,包括虽小但具有重要效应的风险比。

总之,资助申请需要根据其相关性和研究方法质量进行评估,而不是在开展研究之前就对现实情况进行定性推断。告诉资助者你的定量问题,为什么该问题很重要,以及计划如何回答问题。如果问题足够重要,研究方法合理,而且遵守了研究方案,那么就不应该关心研究假设的定性答案是什么(即是或否增加癌症风险)。

参考文献:JAMA. 2024;331(4):285-286. doi:10.1001/jama.2023.27163