预防医学_景兴科 主编;晏志勇 主编_AZW3_MOBI_EPUB_PDF_电子书(无页码)_景兴科 主编;晏志勇 主编
内容节选
第十四章直线回归与相关 学习目标: 掌握:回归分析的基本思想与方法、基本概念、回归系数检验的意义及其方法;利用散点图确定两个数值变量之间是否存在线性关系,把握线性相关的应用条件,能计算相关系数并进行假设检验;相关与回归分析的区别和联系。 熟悉:总体回归系数的统计推断;对不同类型的变量,会用不同的统计方法分析它们之间的关系。 了解:总体回归线的95%置信带与个体预测值的区间估计。 第一节 直线回归和直线相关的概念 前面章节中,我们主要学习了不同处理组间的某一变量比较,但在大量的医学研究中还需要对两个变量之间的关系进行研究,如研究某年龄儿童的身高与体重的关系、给药途径与疗效的关系等。为了研究事物或现象之间的关系,常采用相关(correlation)和回归(regression)分析方法。相关分析是用于研究事物或现象之间有无关系、关系的方向和密切程度,回归分析是研究事物或现象之间的数量依存关系。研究事物或现象间的线性关系用直线相关分析,计算相关系数并进行假设检验;研究事物或现象间的线性数量依存关系用直线回归分析,计算回归系数和截距,对回归系数进行假设检验,若回归系数有统计学意义,则可建立直线回归方程。本章仅介绍两个变量间线性关系的分析方法。 【课堂互动】 若想研究吸烟与肺癌的发生有无关系,应采取何种统计方法? 第二节 直线相关分析 一、直线相关分析的概念 如果两个随机变量中,其中一个变量由小到大变化时,另一个变量也相应地由小到大(或由大到小)变化,并且其相应变化的散点图在直角坐标系中呈现直线趋势,则称这两个随机变量存在直线相关关系。推断两个随机变量是否存在直线相关关系。描述这种相关关系大小的分析方法就是直线相关分析(linear correlation analysis),也称简单相关分析。直线相关分析主要用于研究两个连续性随机变量X和Y之间的线性关系。例如,研究血压和血糖之间的线性关系,回答两者之间是否存在线性关系、关系是否密切以及它是正相关还是负相关。 二、直线相关分析的一般步骤 (1)绘制散点图,观察两变量的变化趋势。 (2)若散点图呈直线趋势,计算相关系数。 (3)对相关系数进行假设检验。 (4)必要时对总体相关系数进行区间估计。 三、直线相关的定量描述 (一)相关系数的概念 为了研究两个连续性的随机变量间有无线性关系,首先要获得两个变量成对观察值的随机样本,n对观测值记为(X1,Y1),(X2,Y2),…,(Xn,Yn)。假定两个变量都是随机变动的且呈正态分布,考察两个随机变量之间有无线性关系,直观的方法是在普通方格纸上绘制散点图。以横坐标表示变量X,纵坐标表示变量Y,将n对观测值绘制成散点图,用其观察坐标点的分布趋势,以了解两个变量之间线性关系如何。 相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。样本相关系数用r表示,总体相关系数用ρ表示。通常情况下,研究时获得的是样本相关系数,计算公式如下: 式中:lXX、lYY分别表示X、Y的离均差平方和;lXY表示X与Y的离均差积和,X、Y代表两个随机变量,计算公式如下: (二)相关系数的意义 相关系数没有单位,其值在-1和1之间波动,其意义如下(图14-1)。 (1)相关系数的符号反映两变量间的相关方向,r>0为正相关,r<0为负相关。 (2)相关系数的绝对值反映两变量相关的密切程度:|r|越大,相关越密切。 (3)r=1为完全正相关;r=-1为完全负相关;r=0为零相关。 图14-1 线性相关示意图 (三)直线相关的定量描述 以例14-1为例介绍直线相关分析的具体步骤。 [例14-1]随机测量了13名8岁健康男童的体重与心脏横径,结果见表14-1。试进行相关分析。 (1)绘制如图1-42所示的散点图,判断体重(X)与心脏横径(Y)之间是否存在线性相关。 图14-2 13名8岁健康男童体重(X)与心脏横径(Y)的散点图 (2)散点图呈直线趋势,计算相关系数。 根据基本数据,得到∑X=301.5,∑X2=7072.75,∑Y=116.3,∑Y2=1044.63,∑XY=2713.65,n=13 代入公式(14-1)、公式(14-2)、公式(14-3)、公式(14-4),计算得 lXX=∑X2-(∑X)2/n=7072.75-301.52/13=80.2692 lYY=∑Y2-(∑Y)2/n=1044.63-116.32/13=4.1923 lXY=∑XY-(∑X)(∑Y)/n=2713.65-301.5×116.3/13=16.3846 四、相关系数的假设检验 例14-1中仅有13名男童的数据,只是总体中的一个样本。样本资料得出的相关系数必然存在抽样误差。即使男童的体重和心脏横径观测值的总体相关系数为O(ρ=0),从该总体抽出的样本相关系数也往往不等于O。因此,要......
- 信息
- 内容简介
- 总序
- 前言
- 绪论
- 第一篇 环境与健康
- 第一章 环境与健康概论
- 第二章 生活环境与健康
- 第三章 生产环境与健康
- 第四章 社会环境与健康
- 第五章 食物与健康
- 第二篇 疾病预防保健策略与措施
- 第六章 疾病的三级预防与社区卫生服务
- 第七章 健康教育与健康促进
- 第八章 常见疾病的防制
- 第三篇 人群健康研究的统计学方法
- 第九章 医学统计学概述
- 第十章 统计表与统计图
- 第十一章 数值变量资料的统计分析
- 第十二章 分类变量资料的统计分析
- 第十三章 秩和检验
- 第十四章 直线回归与相关
- 第四篇 人群健康研究的流行病学方法
- 第十五章 流行病学概述
- 第十六章 疾病的分布
- 第十七章 常用的几种流行病学研究方法
- 第十八章 病因研究
- 第五篇 预防医学实训指导
- 实训一 职业中毒案例讨论
- 实训二 膳食调查
- 实训三 食物中毒案例讨论分析
- 实训四 统计表与统计图的制作
- 实训五 数值变量资料的统计描述
- 实训六 数值变量资料的统计推断
- 实训七 分类变量资料的统计分析
- 实训八 病例对照调查分析
- 附录
- 附录A 生活饮用水水质常规检验项目及限值
- 附录B 国法定职业病目录
- 附录C t界值表
- 附录D χ2界值表
- 附录E T界值表
- 附录F T界值表
- 附录G H界值表
- 参考文献