admin 管理员组文章数量: 1184232
2024年4月16日发(作者:js中的replace函数)
数据库处理 xpose,clear
sort x 对变量x中数值从小到大进行排列
gsort x 对变量x中数值从小到大进行排列
gsort -x 对变量x中数值从大到小进行排列
drop x1 x2 /* 删除变量x1和x2
drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1
和x5)
drop if x<0 /* 删去x<0的所有记录
drop in 10/12 /* 删去第10~12个记录
drop if x==. /* 删去x为缺失值的所有记录
drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录
drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录
drop _all /* 删掉数据库中所有变量和数据
keep in 10/20 /* 保留第10~20个记录,其余记录删除
keep x1-x5 /* 保留数据库中介于x1和x5间的所有变量(包括
x1和x5),其余变量删除
keep if x>0 /* 保留x>0的所有记录,其余记录删除
generate /* 新变量=表达式
generate bh=_n /* 将数据库的内部编号赋给变量bh。
generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5
个1,5个2,5个 3……。直到数据库结束。
generate y=log(x) if x>0 /* 产生新变量y,其值为所有x>0的对数值
log(x),当x<=0时,用缺失值代替。
replace 变量=表达式
replace bolck=6 if block==0 /*将block=0的数全部替换为6。
replace z=. if z<0 /* 将所有小于0的z值用缺失值代替。
replace x = 25 in 17 /* 将第17条记录中的变量x替换为25。
rename 原变量名 新变量名
统计描述
sum x
sum x,d
sum x if x<140
sum x if x<140,d
centile x
centile x,centile(25,50,75)
means x
gra 变量名 ,bin(#) freq normal
graph 各类频数变量名,pie
样本均数的可信区间估计
仅有原始资料,统计量未知时:ci 变量名
统计量已知时:cii 样本含量 样本均数 样本均数标准差
总体平均事件数的可信区间:
ci 变量名,exposure(暴露变量) 其他选项
ci x ,exposure(time)
ci x, exposure(time) level(90)
样本平均计数已知时
cii 观察单位数 样本事件数,poisson 其他选项
样本均数与总体均数比较的t检验
有原始数据时
ttest 变量名= #val
仅有数据之统计量时
ttesti #obs #mean #sd #val
配对设计t检验
ttest 变量1=变量2
gen d=x1-x2
ttest d=0
成组设计t检验
-ttest 变量1=变量2, unpaired
ttest 变量,by(分组变量)[unequal welch] /*数据放入同一组,用分组变
量区分
ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2
单因素方差分析及方差齐性检验
Stack a b c,into(x) 把几个变量边成一个
oneway 响应变量 分组变量
注意:方差分析时数据必须按特定形式输入,即新定义一分组变量 g ,而将不
同处理组的 观察值以某变量 x 表示。
各组均数两两比较
oneway x group,noanova sch noanova /* 不打印方差分析表
scheffe /* Scheffe法
(配伍组设计)两因素的方差分析结果
anova x group block
两组资料间的方差齐性检验
Sdtest x1=x2
样本率和总体率的假设检验
直接概率计算法
bitest varname = #p
bitesti #N #succ #p
近似正态法
prtest 变量名 = #
prtesti #obs #p1 #p2
prtesti #obs 阳性数1 #p2 ,count
两个率的假设检验
Prtesti obs1 p1 obs2 p2 , count
多个率多比较
tab group
tab sex
tab sex group
tab group,sum(x)
tab sex,sum(x) tab group sex,sum(x)
四格表的卡方检验
N>=40,T>=5 tabi 15 711 33,row all
B+c<=20, tabi 15 711 33
配对四格表
mcci #a #b #c #d 注意考察B+c
R*C表的卡方检验 多组构成比的比较
tabi 188 1610 2349 333 , expect chi2 lrchi2
确切概率法(exact probabilities method)
适用条件:
1、两个率比较时,T<=1或n<=40;
2、多个率或构成比比较时,1/5以上格子的理论频数小于5,或有一个理论频
数小于1。
秩 变 换:
genrank 新变量= 原变量
egen 新变量=rank(原变量)
配对资料的秩和检验
signrank a=b if a!=b
两组资料的秩和检验
ranksum 观察值变量,by(分组变量)
两组资料的秩和检验
• expand f
• ranksum x,by(g)
多组资料的秩和检验
• kwallis 观察值变量, by(分组变量)
• expand f
• kwallis x分组,by (g)
直线相关和回归分析:
• gra y x
• cor y x
• pwcorr ,sig star(0.05)
• reg y x 回归系数的t检验与回归方程的方差分析等价
• predict yhat 回归基础上预测
• gra y yhat x, c( .l ) s( Oi) xlab(11,12 to 17) ylab (5,5.5 to
6.5)
等级相关
spearman 变量1 变量2
版权声明:本文标题:stata 命令 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1713257163a626267.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论