近年来,类似“p值已死”的观点总要时不时地跳出来,刺激一下大家。但是立马丢了它,该怎么衡量我做的研究结果到底“显不显著”,能不能见刊?也成了一大问题!也不能赖研究者一味追求“p<0.05”,环境使然!这个环境(推崇p<0.05)什么时候开始的呢?今天带着大家换个角度看看过去20多年来P值的变化。
1、越来越流行的p值
虽说p值用的越来越多,如果论文没几个p<0.05的结果都不好意思跟同行打招呼,但是p值有多流行,恐怕没几个人能说清楚。
Chavalarias等人[1]基于超过1200万篇MEDLINE摘要和80万篇PubMed Central(PMC)全文(包含摘要)的自动文本挖掘,系统阐述了过去25年(1990-2015年)生物医学文献中的P值变化。该研究已在JAMA上发表。
研究者发现,随着时间的推移,越来越多的科学论文在研究结果中报告了P值。MEDLINE摘要中P值出现比例从1990年的7.3%上升到2014年的15.6%,其中随机对照试验高居首位,摘要中报告P值的比例达54.8%(95%CI, 54.0% - 55.6%);Meta分析增长速度最快,在过去的二十年中几乎增加了三倍,达到35.7%(95%CI, 34.5%-37.0%)。
有P值的摘要和全文中,96%会至少报告1个“统计学显著”的结果,报道最多的情况是“p<0.05或p<0.001”。
研究者进一步对其中796篇摘要和99篇全文进行了人工阅读,发现P值出现的比例分别为15.7%和55%,而仅有2.3%摘要和4%全文报告了置信区间,针对不同类型效应值的报告情况差别较大(见下表)。
2、“后p<0.05时代”
确认删除