一、啤酒与尿布的故事
20世纪90年代,美国沃尔玛超市管理人员分析销售数据时,发现了一个令人难以理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品,会经常出现在同一个购物篮中,且大多出现在年轻的父亲身上。分析背后原因是,在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲去超市买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒。由此,沃尔玛就在卖场尝试将啤酒与尿布摆放在相同区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物,从而极大提升商品销售收入。
90年代的这个故事就已经告诉我们,大数据挖掘的重要性。你有没有想过,超市里的商品摆放是有规则的,数据分析师通过分析上万的购物小票,分析出哪些商品最常在一起购买,从而决定商品摆的更远还是更近?你有没有想过,你每次在某宝某东买了某件东西之后,系统就给你推荐了关联的东西,而且有时还挺不错?你又有没有想过,你刷某音的时候,为什么它好像知道你的内心想法,源源不断地给你推荐小姐姐或小哥哥?现在的数据学家们把这种分析叫做关联规则,关联规则和我们的日常生活息息相关。
二、关联规则在临床研究中的应用
那么关联规则在医学上有什么应用呢?在医学领域关联规则常被用来发现数据间隐含的关联关系,如疾病与症状间的关联规则、疾病并发症的关联研究、用药和方剂配伍规则研究、病症-辨证-处方关联研究、药物间相互作用分析、药品分类和剂型关联分析、症状与药物间的关联关系。这时,作为一名称职的医学生/医生,你会有恍然大悟的感觉:哦!这不就是横断面研究吗?
是的,疾病的发生(y)可能和成百上千的病因(x)有关,我们不可能一上来就用先单因素后多因素这一套,我们可以通过关联规则找到初步的联系,再进一步分析。而如果要做到这种大数据疾病的研究,SPSS Statistics是远远不够的。
确认删除