admin 管理员组

文章数量: 1086019


2024年3月13日发(作者:走组词100个)

(完整)统计学名词解释

名词解释:

医学统计学:用统计学的原理和方法研究生物医学问题的一门学科.

变量(variable):观察单位的某项特征

变量值(value of variable):变量的观察结果(测量值)

总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种

变量值的集合。

样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。

随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。

同质(homogeneity):是针对被研究指标来讲,其影响因素相同.简单地理解就是指对研究指标影响大约可

以控制的主要因素应尽可能相同。

变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。

等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为

等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡.有序变量(定性变量的一种)。

概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明

A事件发生的可能性越大,0〈P(A)<1,小概率事件.

频率(frequency):在相同的条件下,独立重复做n次实验,事件A出现了m次,比值m/n称为随机事件A

在n次实验中出现的频率。

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系

统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计.

系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造

成,有一定倾向性或规律性的误差,可以避免.

随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的

取值服从特定的概率分布。

参数(parameter):根据总体分布特征而计算的总体统计指标。

统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。

频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的

频繁程度。

算术均数(arithmetic mean):描述一组数据在数量上的平均水平。总体均数用µ表示,样本均数用

X

表示。

几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G.

中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两

个变量的平均值。

极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R。

百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。

四分位数间距(inter quarnle range):表示百分位数P

75

和百分位数P

25

之差,定义为Q=P

75

—P

25

。。

方差(variance):表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

标准差(standard deviation):是描述反映正态分布计量资料离散程度的指标。是方差的正平方根,使用的

量纲与原量纲相同,适用于近似正态分布的资料,大小样本均可,最为常用。

变异系数(coefficient of variation):用于量纲不同和变量间或均数相差较大的变量间变异程度的比较,

其计算公式为:

CV=

S

100%

X

正态曲线(normal curve)是函数f(X)=

1

2

e

(x

)

2

2

2

对应的曲线,此曲线是一条高峰位于中央,两侧逐

渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。

正态分布(normal distribution):若指标X的频率曲线对应于正态曲线,则称该指标服从正态分布,通常用

(完整)统计学名词解释

记号N(µ,σ)表示均数为标准差为的正态分布。

标准正态分布(standard normal distribution):均数为0标准差为1的正态分布为标准正态分布,记为

N(0,1).

2

标准化转换(standardized transformation):若随机变量X服从正态分布N(µ,σ),经过标准化转换

X

Z=,就服从标准正态分布。

2

统计推断(statistical inference):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程

为统计推断。

抽样误差(sampling error):由个体差异产生,由于抽样而造成的样本统计量与样本统计量及样本统计量与

总体参数之间的差异称为抽样误差,无倾向性,不可避免。

均数的标准误(standard error of mean SEM):用于表示均数抽样误差的指标,反映样本均数之间的离散

程度和样本均数抽样误差的大小。

可信区间(confidence interval CI):为按预先给定的概率确定的包含未知总体参数的可能范围,含义是包

含总体参数的可能性是1—a.

自由度:n个变量中,可自由取值的变量的个数。

参数估计:用样本指标(统计量)估计总体指标(参数),有点估计和区间估计两种。

假设检验中P的含义:指从H

0

规定的总体随机抽得的等于及大于(或等于及小于)现有样本获得的检验统计

量值的概率.

I类错误:拒绝了实际上成立的H

0

这类弃真的错误称为I类错误,概率大小用alfa表示。

II类错误:接受了实际上不成立的H

0

这类存伪的错误称为II类错误,概率大小用β表示。

检验效能:是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。数值表示:1—β

检验水准:是预先规定的,当假设检验结果拒绝H

0

接受H

1

下有差别的结论时犯错误的概率称为检验水准,记

为α

均方:有离均差平方和被自由度相除而得。

方差分析:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或

多个部分,除随机误差外,其余每个部分的变异可由某个或某几个因素的作用加以解释,通过各变异来源地

均方与误差均方比值的大小,借助F分布做出统计推断,判断各因素对观测指标有无影响。

总变异:样本中全部实验单位差异称为总变异,其大小可用全部观察值的均方表示.

组间变异:各处理组间观察值大小不等,这种变异称为组间变异,可用组间均方表示.

组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示.

完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应。

随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相

近,且受试对象数与处理因素的水平相等,然后将每个区组内的观察对象随机地分配到各处理组。

相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有“率,构成比,比”

等。

率:频率指标,说明一定时期内某现象发生的频率或强度,计算公式为发生某现象的观察单位数除以可能发

生某现象的观察总体值*100% 表示方式有百分率%,千分率。

构成比:构成指标。说明某一事物内部的各组成部分所占的比重或分布,计算公式为:某一组分的观察单位

数除以同一事物各组分的观察单位总数*100%,表示方法有百分数等。

A

比相对比.是AB两个有关指标之比,说明A是B的若干倍或百分之几,计算公式为比等于。

B

标准化法:常用于内部构成不同的两个或多个率比较的一种方法,基本思想是指定一个统计标准,按指定标准

计算调制率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响.

定基比:统一用某个时间的指标作为基数,其它各时间的指标与之相比。

环比:以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。

平均增长速度:用于概括某一时期的平均速度变化,即该时期环比的几何均数减1.计算公式为平均增长速度=


本文标签: 指标 观察 样本 总体 统计