admin 管理员组

文章数量: 1184232


2024年4月16日发(作者:js中的replace函数)

数据库处理 xpose,clear

sort x 对变量x中数值从小到大进行排列

gsort x 对变量x中数值从小到大进行排列

gsort -x 对变量x中数值从大到小进行排列

drop x1 x2 /* 删除变量x1和x2

drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1

和x5)

drop if x<0 /* 删去x<0的所有记录

drop in 10/12 /* 删去第10~12个记录

drop if x==. /* 删去x为缺失值的所有记录

drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录

drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录

drop _all /* 删掉数据库中所有变量和数据

keep in 10/20 /* 保留第10~20个记录,其余记录删除

keep x1-x5 /* 保留数据库中介于x1和x5间的所有变量(包括

x1和x5),其余变量删除

keep if x>0 /* 保留x>0的所有记录,其余记录删除

generate /* 新变量=表达式

generate bh=_n /* 将数据库的内部编号赋给变量bh。

generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5

个1,5个2,5个 3……。直到数据库结束。

generate y=log(x) if x>0 /* 产生新变量y,其值为所有x>0的对数值

log(x),当x<=0时,用缺失值代替。

replace 变量=表达式

replace bolck=6 if block==0 /*将block=0的数全部替换为6。

replace z=. if z<0 /* 将所有小于0的z值用缺失值代替。

replace x = 25 in 17 /* 将第17条记录中的变量x替换为25。

rename 原变量名 新变量名

统计描述

sum x

sum x,d

sum x if x<140

sum x if x<140,d

centile x

centile x,centile(25,50,75)

means x

gra 变量名 ,bin(#) freq normal

graph 各类频数变量名,pie

样本均数的可信区间估计

仅有原始资料,统计量未知时:ci 变量名

统计量已知时:cii 样本含量 样本均数 样本均数标准差

总体平均事件数的可信区间:

ci 变量名,exposure(暴露变量) 其他选项

ci x ,exposure(time)

ci x, exposure(time) level(90)

样本平均计数已知时

cii 观察单位数 样本事件数,poisson 其他选项

样本均数与总体均数比较的t检验

有原始数据时

ttest 变量名= #val

仅有数据之统计量时

ttesti #obs #mean #sd #val

配对设计t检验

 ttest 变量1=变量2

 gen d=x1-x2

 ttest d=0

成组设计t检验

-ttest 变量1=变量2, unpaired

ttest 变量,by(分组变量)[unequal welch] /*数据放入同一组,用分组变

量区分

ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2

单因素方差分析及方差齐性检验

Stack a b c,into(x) 把几个变量边成一个

oneway 响应变量 分组变量

注意:方差分析时数据必须按特定形式输入,即新定义一分组变量 g ,而将不

同处理组的 观察值以某变量 x 表示。

各组均数两两比较

oneway x group,noanova sch noanova /* 不打印方差分析表

scheffe /* Scheffe法

(配伍组设计)两因素的方差分析结果

anova x group block

两组资料间的方差齐性检验

Sdtest x1=x2

样本率和总体率的假设检验

直接概率计算法

bitest varname = #p

bitesti #N #succ #p

近似正态法

prtest 变量名 = #

prtesti #obs #p1 #p2

prtesti #obs 阳性数1 #p2 ,count

两个率的假设检验

Prtesti obs1 p1 obs2 p2 , count

多个率多比较

tab group

tab sex

tab sex group

tab group,sum(x)

tab sex,sum(x) tab group sex,sum(x)

四格表的卡方检验

N>=40,T>=5 tabi 15 711 33,row all

B+c<=20, tabi 15 711 33

配对四格表

mcci #a #b #c #d 注意考察B+c

R*C表的卡方检验 多组构成比的比较

tabi 188 1610 2349 333 , expect chi2 lrchi2

确切概率法(exact probabilities method)

适用条件:

1、两个率比较时,T<=1或n<=40;

2、多个率或构成比比较时,1/5以上格子的理论频数小于5,或有一个理论频

数小于1。

秩 变 换:

genrank 新变量= 原变量

egen 新变量=rank(原变量)

配对资料的秩和检验

signrank a=b if a!=b

两组资料的秩和检验

ranksum 观察值变量,by(分组变量)

两组资料的秩和检验

• expand f

• ranksum x,by(g)

多组资料的秩和检验

• kwallis 观察值变量, by(分组变量)

• expand f

• kwallis x分组,by (g)

直线相关和回归分析:

• gra y x

• cor y x

• pwcorr ,sig star(0.05)

• reg y x 回归系数的t检验与回归方程的方差分析等价

• predict yhat 回归基础上预测

• gra y yhat x, c( .l ) s( Oi) xlab(11,12 to 17) ylab (5,5.5 to

6.5)

等级相关

spearman 变量1 变量2


本文标签: 变量 检验 样本 数据库 均数