作者:欢畅封面:云哲忆
历史文章,点击进入人物名称世间最理想的爱情,当然是两颗同心,一生相濡以沫。擦肩而过,只能说彼此情深缘浅。放手成全,可能给人感觉言过凄美,听着有些颇为冷情,可谁也不能否认这不是因为爱情。
在日常的工作研究中,你是否也曾遇到过这样的判别问题——
根据根、茎、叶等特征,判别某种植物是属于裸子植物还是被子植物?
根据风速、风对地上物体所引起的现象,判别某阵风的风力等级是0~12中的哪一级?
根据人均消费水平、人均国民收入等指标,判别某个国家是属于发达国家、中等发达或发展中国家?
根据症状、体征、生化指标等,判别某名阑尾炎患者所患的阑尾炎是卡他型、蜂窝织炎型、坏疽型还是腹膜型阑尾炎呢?
……
我们可以看到列举的问题都是将样品判别至已知的归类,而我们需要做的是:确定一种判别方法,建立由数值指标构成的分类规则,即判别函数,然后把已建立的规则应用到未知分类的样本中,判定一个新的样品应归属于其中的哪一类。
判别分析(discriminantanalysis)
定义:根据判别对象若干个指标的观测结果判定其应属于哪一类的数据统计方法。
??比如,根据病人(判别对象)的症状、体征、生化指标(指标的观测结果),判别该患者所患的阑尾炎是卡他型、蜂窝织炎型、坏疽型、腹膜型阑尾炎中的哪一类(哪一类)。
目的:利用多个预测指标(predictorvariables)建立判别函数或概率公式以判断个体所属分类。
??比如,病人的腹痛部位、体温是否高于37℃、白细胞总数是否高于1×,纳入这些定性预测指标;假设该病人所患为某一型的阑尾炎,那么他同时出现右下腹疼痛、体温高于37℃,白细胞总数高于1×的概率各是多少,最后把这名病人归为概率最大的一类。
资料:个体分两类或多类。
??比如,是否患有阑尾炎(两类),患有的阑尾炎是卡他型、蜂窝织炎型、坏疽型和腹膜型四类的哪一类(多类)。
方法:Fisher判别(又称典则判别),Bayes判别、最大似然判别法、Bayes公式判别、逐步判别。
Fisher判别一般用于指标为定量资料的两类判别,Bayes判别多用于指标为定量资料的多类判别;
最大似然判别和Bayes公式判别适用于指标为定性资料的两类或多类判别;
逐步判别与选择(局部)最优回归子集的逐步回归类似,用于选取具有判别效能的指标来建立判别函数,使判别函数简洁且效果稳定。
“下期内容:Fisher判别
由于部分判别方法的原理间相互联系,实践中容易因混淆而发生错误解读,所以我们推文内容将按照Fisher判别→最大似然判别→Bayes公式判别→Bayes判别→逐步判别的顺序,展开介绍各种判别方法的基本原理及应用,敬请期待。
”参考资料:医学统计学第4版(孙振球徐勇勇)
本期作者
颜欢畅(南方医科大学流行病与卫生统计学)
流行病学实验设计与分析,生存分析,判别分析,多元线性回归,ROC曲线分析等。
温馨提==示学堂正在招募内容主笔、短视频创作者、课程讲师,请在