admin 管理员组文章数量: 1086019
2024年4月16日发(作者:软件工程设计模式有哪些)
1 绪 论
1.1课题背景
随着社会经济不断发展,科学技术的不断进步,人们已经进入了信息时代,
要在大量的信息中获得有科学价值的结果,从而统计方法越来越成为人们必不可
少的工具和手段。多元统计分析是近年来发展迅速的统计分析方法之一,应用于
自然科学和社会各个领域,成为探索多元世界强有力的工具。
判别分析是统计分析中的典型代表,判别分析的主要目的是识别一个个体所
属类别的情况下有着广泛的应用。潜在的应用包括预测一个公司是否成功;决定
一个学生是否录取;在医疗诊断中,根据病人的多种检查指标判断此病人是否有
某种疾病等等。它是在已知观测对象的分类结果和若干表明观测对象特征的变量
值的情况下,建立一定的判别准则,使得利用判别准则对新的观测对象的类别进
行判断时,出错的概率很小。而Fisher判别方法是多元统计分析中判别分析方法
的常用方法之一,能在各领域得到应用。通常用来判别某观测量是属于哪种类型。
在方法的具体实现上,采用国内广泛使用的统计软件SPSS
(Statistical Product and Service Solutions),它也是美国SPSS公司在
20世纪80年代初开发的国际上最流行的视窗统计软件包之一
1.2 Fisher判别法的概述
根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等。Fisher
判别法是判别分析中的一种,其思想是投影,Fisher判别的基本思路就是投影,
针对P维空间中的某点x=(x1,x2,x3,„,xp)寻找一个能使它降为一维数值的线
性函数y(x):
y
x
C
j
x
j
然后应用这个线性函数把P维空间中的已知类别总体以及求知类别归属的
样本都变换为一维数据,再根据其间的亲疏程度把未知归属的样本点判定其归
属。这个线性函数应该能够在把P维空间中的所有点转化为一维数值之后,既能
最大限度地缩小同类中各个样本点之间的差异,又能最大限度地扩大不同类别中
各个样本点之间的差异,这样才可能获得较高的判别效率。在这里借用了一元方
差分析的思想,即依据组间均方差与组内均方差之比最大的原则来进行判别。
1.3 算法优缺点分析
优点:(1)一般对于线性可分的样本,总能找到一个投影方向,使得降维
后样本仍然线性可分,而且可分性更好即不同类别的样本之间的距离尽可能远,
同一类别的样本尽可能集中分布。
(2)Fisher方法可直接求解权向量
w
*
;
(3)Fisher的线性判别式不仅适用于确定性模式分类器的训练,而且对于
随机模式也是适用的,Fisher还可以进一步推广到多类问题中去
缺点:
(1)如果
M
1
M
2
,
w
*
0
,则样本线性不可分;
M
1
M
2
,未必线性可
分;
S
w
不可逆,未必不可分。
(2)对线性不可分的情况,Fisher方法无法确定分类
2 实验原理
2.1 线性投影与Fisher准则函数
各类在
d
维特征空间里的样本均值向量:
M
i
1
n
i
x
k
X
i
x
k
,
i1,2
(2.5-2)
通过变换
w
映射到一维特征空间后,各类的平均值为:
m
i
1
n
i
y
k
Y
i
y
k
,
i1,2
(2.5-3)
映射后,各类样本“类内离散度”定义为:
S
i
2
y
k
Y
i
2
(ym)
ki
,
i1,2
(2.5-4)
显然,我们希望在映射之后,两类的平均值之间的距离越大越好,而各类的
样本类内离散度越小越好。因此,定义Fisher准则函数:
|m
1
m
2
|
2
J
F
(w)
2
s
1
s
2
2
(2.5-5)
使
J
F
最大的解
w
*
就是最佳解向量,也就是Fisher的线性判别式。
版权声明:本文标题:(完整版)判别分析中Fisher判别法的应用 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713200596a623590.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论