作者:李健民
上一篇文章我们简单介绍了人工智能和大数据的结合(详情请查看:作为医生,怎么跟进人工智能不落伍?写给医生的人工智能体验课),今天这篇文章接着介绍深度学习的数学模型。
在这篇文章开始前,首先需要声明:神经网络是深度学习的基础,其数学原理有一定难度,涉及了微积分和线性代数的内容,从头开始学习这些内容对于多年不接触高数的临床医生来说是不现实的。但是不理解这些基本概念,后续的内容无法展开。要精确地表达这些数学内容,势必会让文章变成数学公式、符号的重灾区,劝退读者。
所以我根据自己的理解,全篇使用比喻的方式进行讲述,或许有很多不准确的地方,但大方向基本是正确的。建议大家对基本概念入门后再翻阅专业的教科书进一步学习。
神经网络就像是一家公司
神经网络就像是一个公司,左边的输入层是底层员工,负责传递信息;中间的隐藏层是干部,负责整理底层员工传达的信息;最右边的输出层就是公司领导,分析干部整理过的信息后,最终做出决定。
举个例子,现在我们有一份数据集,收集了100名患者的性别、年龄、家族史、吸烟史、既往病史等10项作为自变量,是否患肺癌作为结局变量。我们的目标是建立一个模型,给出一名新患者的10项自变量就能预测患者是否患肺癌。因为有10列数据,那么底层员工(输入层)就有10个,公司配备了一层干部(一层隐藏层),包括3个干部(隐藏层神经元)。
这3个干部整理好10个基层员工的信息,让领导(输出层)做决定。因为输出结果是二分类,输出层一般为2个。领导可以睁眼看外部,他会反复研究已知的100名患者的结局,对比干部的信息,最后做出决定,这个患者究竟是不是真的有肺癌。
每个员工都有他的脾气
确认删除