第十章 线性回归和逐步回归命令和输出结果说明

2012-04-17 生物谷 生物谷

本 节STATA 命 令 摘 要: regress  因变量   变 量1 变 量2… 变 量m,beta stepwise  因变量   变 量1 变 量2… 变 量m,ba  forw  st fe(#)  fs(#) test   表 达 式 predict&

本 节STATA 命 令 摘 要:

regress  因变量   变 量1 变 量2 变 量m,beta

stepwise  因变量   变 量1 变 量2 变 量m,ba  forw  st fe(#)  fs(#)

test   表 达 式

predict   新变量

predict    新 变 量,resi

predict    新 变 量,stdp

predict    新 变 量,stdr

 regress 命 令 表 示 作 线 性 回 归, 其 子 命 令 beta 表 示 得 到 的 回 归 系 数 为 标 化 的 回 归 系 数( 即: 无 量 纲)。stepwise 命 令 表 示 作 逐 步 线 性 回 归, 其 子 命 令:ba 表 示 后 退 法 筛 选 自 变 量;form 表 示 向 前 法 筛 选 自 变 量;st 表 示 前 进 后 退 法 筛 选 变 量;fe(#) 表 示 在 筛 选 变 量 中,  变 量 选 入 模 型 的 F 统 计 量 的 临 界 值(#), 在STATA 中, 其 缺 省 值 为 0.5, 最 大 设 置 值 不 要 大 于 4;fs(#) 表 示 在 筛 选 变 量 中,  变 量  从 模 型 中 剔 除 的 F 统 计 量 的 临 界 值(#), 在STATA 中, 其 缺 省 值 为 0.1,最 大 设 置 值 不 要 大 于 4。test 用 于 检 验 回 归 系 数 的 表 达 式, 如: 某 两 个 回 归 系 数 是 否 相 等。 predict   新 变 量   是 根 据 线 性 回 归 方 程 计 算 每 个 自 变 量 记 录 所 对 应 的 y 值( 一 些 文 献 上 称 预 测 值 和 期 望 估 计 值)。predict  新 变 量,resi  计 算 残 差 值。predict   新 变 量,stdp

 是 计 算 因 变 量 y 的 总 体 均 数 估 计 的 标 准 误( 不 同 的 自 变 量 值, 该 标 准 误 也 不 同)。predict  新 变 量,stdr    是 计 算  因 变 量 y  的 预 测 值 的 标 准 误。

 例: 对 15 名 对 象 的 血 浆 粘 度(Y) 及 其 3 个 血 浆 成 分: 白 蛋 白(x1), 球 蛋 白(x2) 和 纤 维 蛋 白 原(x3) 进 行 测 定, 试 建 立 多 元 线 性 回 归 方 程。 其 数 据 如 下 表( 数 据 摘 自 医 用 多 元 统 计 分 析, 曹 素 华 主 编):

 

y

x1

x2

x3

1

1.73

4500

1500

1000

2

1.47

4200

1400

360

3

1.50

2700

1900

280

4

1.47

5200

1000

156

5

1.46

3700

2300

207

6

1.56

4200

1770

355

7

1.49

1700

2100

578

8

1.40

4650

950

231

9

1.46

5900

1550

416

10

1.38

3840

1410

391

11

1.66

3800

2650

515

12

1.57

5300

1900

435

13

1.90

4090

1820

357

14

1.20

3500

1700

300

15

2.20

3000

1790

820

regress y x1 x2 x3

                                            

 Source    |       SS            df         MS                     Number of obs =      15 

-----------+------------------------------                    F(  3,    11) =    2.39 

      

   Model  |  .314572294     3  .104857431            Prob > F      =  0.1239 

      

Residual  |  .481761032    11  .043796457            R-squared     =  0.3950 

--------  -+------------------------------                      Adj R-squared =  0.2300 

   Total    |  .796333326    14  .056880952               Root MSE      =  .20928 

--------------------------------------------------------------------------------------------- 

                                                                                             

       y     |      Coef.      Std. Err.         t        P>|t|          [95% Conf. Interval] 

----------+---------------------------------------------------------------------------------- 

      x1    |   9.57e-06   .0000596      0.161   0.875      -.0001217    .0001408 

      x2    |   .0000724   .0001414      0.512   0.619      -.0002389    .0003837 

      x3    |   .0006278   .0002514      2.497   0.030       .0000745    .0011811 

   _cons  |   1.132732   .4274603      2.650   0.023       .1918985    2.073566 

----------------------------------------------------------------------------------------------- 

① 离 均 差 平 方 和;② 自 由 度;③ 均 方 差; ④ 模 型 回 归 系 数 全 为 0 的 无 效 假 设 检 验 对 应 的 F 值;⑦ 为 F 检 验 相 应 的 p 值; ⑤ 为 回 归 项: 对 应 为 回 归 平 方 和 和 回 归 均 方 差;⑥ 残 差 项, 对 应 为 残 差 平 方 和、 残 差 自 由 度 和 残 差 均 方 和;⑧ 为 决 定 系 数;⑨ 为 调 整 自 由 度 后 的 决 定 系 数; 为 残 差 均 方 和 的 根 号; 回 归 系 数; 回 归 系 数 的 标 准 误; 回 归 系 数 检 验 的 t  值; 回 归 系 数 检 验 相 应 的 p  值; 回 归 系 数 的 95% 可 信 限。

线 性 回 归 模 型 假 定 残 差 呈 正 态 分 布 其 齐 性, 独 立 于 所 有 回 归 自 变 量, 因 此 应 对 残 差 作 正 态 性 检 验 和 残 差 分 析, 由 于 这 部 分 内 容 已 超 出 了 本 教 材 的 范 围, 所 以 不 在 此 处 详 细 介 绍。  以 本 例 数 据 介 绍 逐 步 线 性 回 归 分 析,  设 筛 选 变 量 进 入 模 型 的 F 值 等 于 变 量 从 模 型 中 剔 除 的 F 值, 并 均 为 1.5, 其 输 出 内 容 对 应 相 同:

stepwise  y x1 x2 x3, fe(1.5) fs(1.5)

Dropping: x1       F=     0.02577                                              

Dropping: x2       F=     0.26297                                               

                                                                             (stepwise) 

  Source   |       SS            df          MS                    Number of obs =      15 

-----------+----------------------------------------            F(  1,    13) =    7.98 

   Model  |  .302861381     1  .302861381                Prob > F      =  0.0143 

Residual  |  .493471945    13   .03795938                R-squared     =  0.3803 

-----------+----------------------------------------            Adj R-squared =  0.3327 

   Total    |  .796333326    14  .056880952               Root MSE      =  .19483 

----------------------------------------------------------------------------------------------- 

       y     |      Coef.          Std. Err.       t           P>|t|       [95% Conf. Interval] 

----------+------------------------------------------------------------------------------------ 

      x3    |   .0006453      .0002284      2.825    0.014       .0001517    .0011388 

   _cons  |   1.287974      .1096994     11.741   0.000       1.050982    1.524965 

------------------------------------------------------------------------------------------------ 

① 为 在 筛 选 变 量 中 剔 除 x1 的 F 检 验 值。

predict  yhat                计 算 因 变 量 预 测 值 yhat

predict  e, resi              计 算 残 差  e

predict  ymuse, stdp    计 算 因 变 量 总 体 估 计 的 标 准 误

predict  yhatse, stdr     计 算 因 变 量 预 测 值 的 标 准 误

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1701376, encodeId=82221e01376bb, content=<a href='/topic/show?id=214ee756845' target=_blank style='color:#2F92EE;'>#线性回归#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=38, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=77568, encryptionId=214ee756845, topicName=线性回归)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=748630348850, createdName=天堂的云, createdTime=Wed Aug 22 20:44:00 CST 2012, time=2012-08-22, status=1, ipAttribution=)]

相关资讯

Stata第六章 卡方检验

本节STATA 命令摘要 [by 分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow] tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow] ·列联表分析 STATA命令: [by分层变量:]tab2变量1变量2[,allchi2lichi2e

Stata第十章 线性回归和逐步回归命令和输出结果说明

本节STATA命令摘要: regress 因变量  变量1变量2…变量m,beta stepwise 因变量  变量1变量2…变量m,ba forwstfe(#)fs(#) test表达式 predict  新变量 predict   新变量,resi

Stata第七章 相关分析

本节STATA 命令摘要 correlate变量名1变量名2…变量名m spearman变量1 变量2 ·       线性关系的相关分析 若计量资料变量1,…,变量m服从正态分布,对于它们之间是否存在线性相关关系可以通过相关分析方法,相应的STATA命令为: pwcorr变量名1变

Stata第九章 多因素方差分析命令与输出结果说明

本节STATA命令摘要: anova  观察变量 分组变量1  分组变量2… 分组变量m tabulate 分组变量1 分组变量2,summarize(观察变量)  在anova命令中分组变量可以是其它分组变量的乘积表达式,如:分组变量1*分组变量2。  例:治疗缺铁性贫血病

Stata第五章多组计量资料比较的非参数检验命令与输出结果说明

本节STATA 命令摘要 ranksum观察变量,by(分组变量) kwallis 观察变量,by(分组变量) ·       秩 和检验(Mann,WhitneyandWilcoxon非参数检验)  对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立

Stata第八章 单因素生存分析

本 节STATA  命 令 摘 要 logrank  生存时间变量  结果变量[,by(分组变量)] 单 因 素 生 存 分 析  在 医 学 研 究 中, 除 了 计 量 资 料 和 计 数 资 料 外, 还 经 常 遇 到 生 存 分 析 的 资 料, 这 种 资 料 不 仅 描 述 所 观 察 对 象 是 否 有 结 果( 死 亡