admin 管理员组文章数量: 1087649
2024年3月13日发(作者:分割图片)
1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更
确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有
限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总
体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每
一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的
过程。随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是
生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或
研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料
称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其
变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、
体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料
(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现
为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,
其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四
种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察
单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治
疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺
序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结
果分为 +、++、+++等。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的
一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P
(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,
则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复
很多次时P(A)= m/n。
6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差
后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的
情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的
某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两
侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和
完善技术措施来消除或使之减少。
8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,
而且,理论上讲,每个变量的取值服从特定的概率分布。
9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽
样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数
附近波动的随机变量。
11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的
出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某
医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据
和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数
用μ表示,样本均数用X 表示。
13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料
的水平。记为G。
14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中
的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次
上的平均水平。
15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其
计算简便但稳定性较差。
16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次
依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。
17.四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相
减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
18.方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和
除以样本个数得到。
19.标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,
适用于近似正态分布的资料,大样本、小样本均可,最为常用。
20.变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时
两组资料变异程度的比较。用CV 表示。计算:标准差/均数*100%
21.统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的
过程称为统计推断(statistical inference)。
22.抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,
称为抽样误差(sampling error)。
23.标准误及X s :通常将样本统计量的标准差称为标准误。许多样本均数的标
准差X s称为均数的标准误(standard error of mean,SEM ),它反映了样本
均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的
大小。
24.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围
称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信
版权声明:本文标题:统计学名词 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1710301890a566894.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论