第五章、流行病学和医学统计学基本知识

时间:2020-08-26 10:07:14 浏览量:

第五章、 流行病学和医学统计学基本知识 第一节、 流行病学的基本知识 一、 基本概念 1)流行病学的定义 1 .是研究疾病、健康状态和事件在人群中的分布、影响和决定因素,用于预防和控制疾病,促进健康的学科。

2.基本内涵有四点:
①它的研究对象是人群,是研究所关注的具有某种特征的人群;

②它不仅研究各种疾病,而且研究健康状态和事件;

③它的重点是研究疾病、健康状态和事件的分布、影响和决定因素;

④最重要的是,它的落脚点是为预防和控制疾病,促进健康提供科学的决策依据。

2) 流行病学的任务 第一阶段:“揭示现象”,即揭示流行(主要是传染病)或分布(其他疾病、伤害与健康)的现象。——健康信息收集 第二阶段:“找出原因、影响或决定因素”,即从现象入手找出流行与分布的规律、原因或影响因素。——健康风险评估 第三阶段:“提供措施”,即合理利用前两阶段的结果,找出预防或干预的策略与措施。——健康指导和健康危险因素干预 3) 流行病学研究的方法 二、 常用指标 1) 率和比 比例(proportion) 率(rate) 表示同一事物局部与总体之间数量上的比值,分子和分母的单位相同,而且分子包含于分母之中。

表示在一定的条件下某现象实际发生的例数与可能发生该现象的总例数之比,来说明单位时间内某现象发生的频率或强度。

常用 P=a/(a+b) 率=(某现象实际发生的例数/可能发生该现象的总人数)/k,k=100%、1000%、1000/万、100000/10万 构成比例:反映事物静止状态内部构成成分占全体的比重,是可以反映某种概率的数值。

率包括:①受累人群数量(可以是某病的临床症状、死亡、残疾、实验室异常等) ②被观察到的受累人群所处的总体数量 ③规定的时间 发生频率比例:它与动态的发生变化概率密切相关,反映一定时间内,发生某种变化者占全体的比例。

2) 发病指标 1.发病率 定义 是指一定时期内特定人群中某病新病例出现的频率。

公式 发病率=(一定时期某人群中某病新病例数/同期暴露人口数)×k,式中,k=100% 、1000%'、10000/万或 100000/10 万。

一般多以年为时间单位,常用 10 万分率来表示。

暴露人口 发病率的分子为新发病例数,有时一个人在观察期间可能多次发生同种疾病,可分别计算为几个新病例。

暴露人口也称危险人口,是指观察期间内观察地区的人群中有可能发生所要观察疾病的人,才能作为分母;
对于不可能患该病的人,不应包括在分母中。暴露人口数不易获得,一般使用年平均人口数。

用途 对于传染病以及死亡率极低或不致死的疾病尤为重要,反映患该病的风险。常用来描述疾病的分布,探讨发病因素,提出病因假设和评价防治措施的效果。

注意事项 发病率准确性受很多因素影响,如报告制度不健全、漏报、诊断水平不高等,比较不同地区的发病率,应考虑年龄、性别构成不同,即进行发病率的标化。

2.患病率 定义 亦称现患率、流行率。患病率是指在特定时间点一定人群中某病新病例和旧病例的人数总共所占的比例。

公式 患病率=(特定时间点某人群中某病新旧病例数/同期观察人口数)×k,式中,k=100%、1000U0000/万或 100000/10 万。

影响因素 主要受发病率和病程的影响,当某地某病的发病率和病程在相当长的实间内保持稳定,则患病率(P)、发病率(I)和病程(D)三者之间存在下述关系:
患病率=发病率×病程 P=I×D 因而可以根据患病率和发病率计算出平均病程 用途 患病率对于病程短的疾病价值不大,而对于病程长的一些慢性病的流行状况能提供有价值的信息,可反映某地区人群疾病的分布以及某疾病的疾病负担程度。可依据患病率来合理地计划卫生设施、人力物力及卫生资源 的需要,研究疾病流行因素,监测慢性病的控制效果 3. 患病率与发病率的区别 ①患病率的分子为特定时间点所调查人群中某病新旧病例数,而不管这些病例的发病时间;
发病率的分子为一定时期暴露人群中新发生的病例数;

②患病率是由横断面调查获得的疾病频率,衡量疾病的存在或流行情况,是一种静态指标,其本质上是一种比例,不是一种真正的率;
发病率是由发病报告或队列研究获得的单位时间内的疾病频率和强度,为动态指标,是一种真正的率 3) 死亡指标 死亡率 病死率 生存率 是指某人群在单位时间内死于所有原因的人数在该人群中所占的比例。死亡率是测量人群死亡危险最常用的指标。

表示一定时期内患某病的全部患者中因该病而死亡的比例。病死率与死亡率不同,病死率并非真正的率,只是一个比值。

又称存活率,是指患某种病的人(或接受某种治疗措施的患者)经n年的随访,到随访结束时仍存活的病例数占观察病例的比例。

死亡率=(某人群某年总死亡人数/该人群同年平均人口数)×k;
式中,k=1000‰或 100000/10万。常以年为单位时间。

病死率=(一定时期内因某病死亡人数/ 同期确诊的某病病例数)×100% 如果某病的死亡专率与发病专率处于比较稳定的状态,病死率也可由死亡专率与发病专率推算而得。

某病病死率=(该病死亡率/该病发病率 ×100% n 年生存率=(随访满n年的某病存活病例数/随访满n年的该病病例数) ×100% ) 粗死亡率:死于所有原因的死亡率,是一种未经调整的死亡率。

病死率通常用于病程短的急性病,如各种急性传染病、脑卒中、心肌梗死及肿瘤等,以衡量疾病对人生命威胁的程度。

生存率常用于评价某些慢性病如恶性肿瘤、心血管病等病程长、病情较重、致死性强的疾病的远期疗效。

死亡专率:按疾病种类、年龄、性别、职业、种族等分类计算的死亡率 病死率受疾病严重程度和医疗水平的影响,同时也与能否早期诊断、诊断水平及病原体的毒力有关。

- 4) 相对危险度 相对危险度(RR) 比值比(OR) 定义 是指暴露组发病率(Ie)与非暴露组发病率 (Io)之比。反应暴露与疾病的关联强度。

又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值,除以对照组中暴露人数与非暴露人数的比值。

计算公式 RR=Ie /Io - 意义 说明暴露组的发病危险是非暴露组的多少 倍。

与 RR 相同,OR 反映暴露者患某种疾病的危险性较无暴露者高的程度。

RR无单位,比值范围在0~∞。RR=1,表明暴露与疾病无联系;
RR<1,表明存在负联系(提示暴露是保护因子);
RR>1,表明两者存在正联系(提示暴露是危险因子)。比值越大,联系越强 若能满足以下两个条件,则OR值接近甚至等于RR值:
①所研究疾病的发病率(死亡率)很低 ②所选择的研究对象代表性好 5) 归因危险度(人群公共卫生意义) 归因危险度(AR) 归因危险度百分比(AR%) 人群归因危险百分比(PAR%) 定义 是指暴露组发病率与非暴露组发病率之差,它是反映发病归因于暴露因素的程度。

是指暴露人群中由暴露因素引起的发病在所有发病中所占的百分比。

表示全人群中由暴露引起的发病在全部发病中的比例。

公式 AR=Ie-Io=Io(RR-l) AR%=[(Ie-Io)/Ie]×100% PAR%=[(It-Io)/It]×l00%,式中,It 为全人群发病率。

或 PAR%={Po(RR-1)/[Po(RR-1)+1]}×l00%,式中,P0 为某因素在人群中的暴露率。

意义 表示暴露者中完全由某暴露因素所致的发病率或死亡率。

- PAR%不仅考虑了暴露因素的RR,而且与某因素在人群中的暴露率(Po)有关。其公共卫生学意义是:完全控制该暴露因素后人群中某病发病(或死亡)率可能下降的程度。

三、 常用的研究方法 1)现况调查 描述性研究:指利用已有的资料或特殊调查的资料(包括实验检查结果),描述疾病或健康状况在不同时间、地点和人群中的分布特征,进一步开展分析流行病学研究提供病因或流行因素的线索。

包括:爆发调查、病例及病例组分析、筛查、生态学研究、现况调查 1.概念:
①现况调查:指在某一人群中,应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾病的关联。

②横断面研究:从时间上说,现况调查是在特定时间点进行的,即在某一时点或短时间内完成,又称横断面研究。

2.现况调查的目的 ①描述疾病或健康状况的分布 ②发现病因线索 ③适用于疾病的二级预防 ④评价疾病的防治效果 ⑤疾病监测 ⑥其他:用于衡量国家或地区卫生水平和健康状况、卫生服务需求的研究、社区卫生规划的制定与评估、检验标准的制定、为卫生行政部门的科学决策提供依据。

3.方法及种类 ①普查:即全面调查,是指特定时间点或时期、特定范围内的全部人群(总体)均为研究对象的调查。

优点:无抽样误差 缺点:不适用于患病率低且无简便易行诊断手段的疾病。

②抽样调查:是通过抽样的方法,对特定时点、特定范围内的人群的一个代表性样本进行调查,以样本的统计量来估计总体参数所在范围。

优点:节省时间、人力物力 缺点:设计实施复杂,不适用变异较大的研究对象或需要普查普治的疾病 非随机抽样:典型调查、偶遇抽样 随机抽样:样本必须遵循随机化的原则 常见的随机抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样。

4. 优缺点 ①优点:
❶常用的是抽样调查,故其研究结果有较强的推广意义,以样本估计总体的可信度高。

❷将样本是否患病或是否暴露来分组比较,即有来自同一群体的自然形成的同期对照组,结果有可比性 ❸采用问卷调查或采样监测等手段,一次调查科同时观察多种因素,是疾病病因探索过程中不可缺少的基础性工作之一 ②局限性:
❶调查时疾病与暴露因素一般同时存在,难以确定先因后果的时相关系 ❷调查得到的是某一时点是否患病情况,故不能获得发病率资料,除非在一个稳定的群体中,连续进行同样的现况调查。

❸研究对象中一些人若正处在所研究疾病的潜伏期或者临床前期,则极有可能会被误认为是正常人,是研究结果发生偏倚,低估该研究群体的患病水平 2) 队列研究 属于分析性研究,分析性流行病学方法则更常用于验证病因假设,其最常见的两大类:队列研究和病例对照研究。

1. 概念:也称群组研究。是将特定的人群是否暴露于某因素或按不同暴露水平分为n个群组或队列,追踪观察一定时间,比较各组发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。

可用于检验病因假设、评价预防效果和研究疾病自然史 2. 方法 3. 类型 ①前瞻性队列研究:研究对象的确定与分组由研究开始时是否暴露来决定,研究结局需随访一段时间才能得到。

②历史性队列研究:研究工作现在开始,而研究对象是过去某个时间进入队列的。特点是追溯到过去某时期决定人群对某因素的暴露史,然后追踪至现在的发病或死亡情况。

③双向性队列研究:以上两个方法的结合。根据历史档案确定暴露与否,随访至将来的某个时间确定结局,又称混合性队列研究 4. 特点 ①在时序上是由前向后的,在疾病发生前开始进行,故属于前瞻性研究。

②属于观察性对比研究 ③研究对象根据暴露与否分组 ④是从“因”到“果”的研究 ⑤追踪观察的是两组间的发病率或死亡率差异。

5. 优缺点 ①优点:
❶资料完整,无回忆偏倚 ❷计算暴露组和非暴露组发病率,能测量两组间特异危险度和相对危险度 ❸一次调查可观察多种结果,并能了解疾病自然史 ❹能直接估计暴露因素与发病的联系强度,且先因后果,时间关系明确,所得联系比较确实可靠。

❺暴露因素的作用可分等级,便于计算剂量-效应关系 ❻样本量大,结果稳定 ❼在有完整资料记录的条件下,可作回顾性历史队列研究。

②局限性:
❶观察时间长、费人力、花费高,不能在较短时间内得到结果 ❷准备工作,设计的科学性要求高,实施难度大 ❸暴露人年计算工作量较为繁重 ❹研究罕见病需要大量研究对象,不易收集到完整可靠的资料,故不适用于罕见的研究。

3) 病例对照研究 队列研究:结果可靠,科学性强,然而耗时和花费较大 病例对照研究:省时、省力,故应用更为广泛。

1. 概念:
病例对照研究为选择一组患所研究疾病的患者与一组无此病的对照组,调查其发病前对某个(些)因素的暴露状况,比较两组中暴露率和暴露水平的差异,以研究该疾病与这个(些)因素的关系。

2. 方法:
3. 特点:
❶在疾病发生后进行,研究开始时已有一批可供选择的病例 ❷研究对象按发病与否分成病例组与对照组 ❸被研究因素的暴露状况是通过回顾获得的 ❹若按因果关系分析,结果已发生,是由果及因的推理顺序 ❺经两组暴露率或暴露水平的比较,分析暴露与疾病的联系 4. 优缺点:
①优点:
❶所需样本量小,病例易获取,工作量相对小,所需物力、人力较少,易于进行,出结果快 ❷可以同时对一种疾病的多种病因进行研究 ❸适合于对病因复杂、发病率低、潜伏期长的疾病进行研究 ❹在某些情况下,还可以对治疗措施的疗效与副作用作初步评价。

②缺点:
❶由于受回忆偏倚的影响,选择合理的对照又较困难,因此结果的可靠性不如队列研究 ❷不能计算暴露与无暴露人群的发病率及相对危险度(RR),只能计算比值比(OR) 4)实验性研究 1. 概念:其基本性质研究者在一定程度上掌握着实验的条件,主动给予研究对象某种干预措施。又称干预研究。

2. 基本特点:
①属于前瞻性研究:干预在前,效应在后 ②随机分组 ③设立对照组 ④有干预措施 3. 临床实验:是在临床上评价新药、新疗法疗效的一种实验,是临床治疗措施在正式应有之前的最后人体应有实验。其目的是观察和论证某个或某些研究因素对研究对象产生的效应或影响。

4. 社区实验:也称生活方式干预实验,是以尚未患所研究疾病的人群作为整体进行实验观察,常用于对某种预防措施或方法进行考核或评价。

5)诊断实验的评价研究 定义 诊断试验是对疾病进行诊断的试验方法。它包括各种实验室检查、病史体检所获得的临床资料、X 线、超声诊断等各种公认的诊断标准,并且利用这些资料和技术标准对疾病和健康状况得出确切的结论。

诊断指标 ①客观指标,即能用客观仪器测定的指标,很少依赖诊断者的主观判断和被诊断者的主诉。②主观指标,即完全根据被诊断者的主诉来决定。

③半客观指标,即根据诊断者的主观感知判断 诊断标准 由于在一个人群中有病与无病的数值有重叠情况,所以诊断指标确定之后,就应该确定一个诊断标准(诊断界值)用以区别正常与异常。确定诊断标准的方法有生物统计学方法、临床判断法和 ROC 曲线法。

在选择诊断标准时一般要遵循以下原则:
①对于一些严重疾病,如能早期诊断则可获得较好的治疗效果,而漏掉一个可能的病例则其后果严重,此时应尽可能保证所有的患者都被诊断出来,即选择敏感度较高的指标;

②对于治疗效果不理想的疾病,且确诊及治疗费用又较昂贵时,或者误诊一个非患者为患者时后果严重,造成严重的精神负担, 则可选择特异度较高的诊断标准;

③当假阳性和假阴性的重要性相等时,一般以正确指数最大时所对应的临界点为最佳诊断界值。

诊断试验的评价指标 1.真实性 ①灵敏度:也称真阳性率,即实际有病且按该诊断试验被正确地判为有病的概率。

②特异度:也称真阴性率,即实际无病且按该诊断试验被正确地判为无病的概率。

③假阴性率:也称漏诊率 ④假阳性率:也称误诊率 ⑤正确诊断指数 2.可靠性 ①变异系数(CV):所测平均数的标准差与测定的均数之比,比值越小,可靠性越好。

②符合率:又称准确度 ③诊断试验的一致性分析 3.收益 ①阳性预测值(+PV):指实验阳性结果中真正患病的比例。

②阴性预测值(-PV):指实验阴性结果中真正未患病的比例。

诊断试验 的评价标 准 1.同金标准诊断方法进行同步盲法比较:在对一项新的诊断试验进行研究和评价时,只有以金标准为基础进行考核,才能获得准确的结果。

2.研究对象的代表性:为保障试验结果的代表性和可推论性,所选择的病例组和非病例组最好是目标人群的一个随机样本。

3.要有足够的样本量。

4.诊断界值的确定要合理:既要考虑该试验检验的目的(筛检或确诊),也要兼顾灵敏度和特异度。

5.不仅评价真实性,也评价可靠性。

6.试验的方法和步骤要具体,有可操作性。

提高诊断质量的方法 1.联合试验 ①平行(并联)实验:即几个试验中只要有一个试验呈现阳性即诊断为阳性。其优点是灵敏度增高,漏诊率降低;
但同时特异度降低,误诊率增高。

②系列(串联)实验:即几个试验中有一个阴性即诊断为阴性全部阳性才能判为阳性。其优点是特异度增高,误诊率降低;
缺点为灵敏度降低,漏诊率增高。

2.选择患病高的人群 一方面可使新发现的病例数增加;
另一方面可使阳性预测值升高,试验成本下降,其结果使试验的效率提高。

6) 筛检试验的评价研究 1.概念 筛检试验通过快速的检验、检查或其他措施,将可能有病但表面上健康的人同那些可能无病的人区分开来。

2.筛检的主要用途 ①筛检最初用于早期发现那些处于临床前期或临床初期的可疑患者,以进行早诊断和早治疗,提高治愈率或延缓疾病的发展,改善预后。

②近年来,筛检试验越来越多地应用于发现某些疾病的高危个体,以预防疾病的发生。

③开展流行病学监测,了解疾病的患病率及其趋势,为公共卫生决策提供科学依据。

④了解疾病的自然史。

3.筛检试验的评价指标 灵敏度和特异度 4.筛检试验的类型和方法 ①筛检的类型 按筛检对象的范围分类,可分为群体筛检和选择性筛检。

②筛检的方法 单项筛检:即用一种筛检试验检査某一种疾病。

多项筛检:多种筛检方法联合使用。

5.筛检的应用原则 ①合适的疾病 ❶筛检的疾病应具有可识别的潜伏期或早期症状期。

❷对疾病的自然史,包括从潜伏期发展到临床期、疾病结局的过程应有足够的了解 ❸对被筛检和诊断出来的病例应有有效而易被群众接受的治疗方法。

②合适的筛检试验 筛检试验的方法必须快速、简单、经济有效,且乐于被群众所接受 ③合适的筛检计划 1) ❶筛检计划应是一个连续的过程,应对可疑病例提供诊断、治疗的方便。对筛检试验阴性者,还应进行定期检查。

2) ❷要考虑筛检、诊断和治疗整个过程的成本与效益问题。

第二节、 医学统计学的基本知识 一、基本概念 1)医学统计学的定义和研究对象 1.定义:统计学通常被定义为“关于数据收集、表达和分析的普遍原理和方法”。

医学统计学:则可定义为“根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科”。

2.研究对象:是具有不确定性的医学数据,其基本的研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。

2)医学统计学的主要内容 1.统计设计 包括调查设计和实验设计。

统计设计是保证统计描述和推断正确的基础 2.统计描述 对原始数据进行归纳整理,用相应的统计指标,如率、均数等,表示出研 究对象最鲜明的数量特征,必要时选择统计表或统计图。

3.统计推断 在统计描述的基础上,对统计指标的差别和关联性进行分析和推断。

3)医学统计资料的类型 1.计量资料 亦称数值变量,为定量测量的结果,通常用专用仪器测量,并有计量单 位,如身高(cm)、体重(kg)等。计量资料有连续性的特点 2.计数资料 计数资料是定性观察的结果。

3.等级资料 介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级 如阴性、阳性、强阳性,治愈、好转、有效、无效等。等级资料与计数资料又可统称为分类变量 4)医学统计工作的基本步骤 研究设计、收集资料、整理资料和分析资料是统计工作的 4 个基本步骤。

1.研究设计 按研究者是否对观察对象施加干预(即处理因素),可以分为调查设计和实验设计两大类。

①调查设计(不加干预):主要是了解客观实际情况的现场工作。

②实验设计(加干预):根据研究对象不同分为动物实验和临床试验(或现场试验)。

无论是调查设计,还是实验设计均包括专业设计和统计学设计两个方面。

2.收集资料 任务 取得准确可靠的原始数据 统计资料的来源 ①经常性资料。

②一时性资料。

统计资料的要求 ①资料必须完整、正确和及时;

②要有足够的数量;

③注意资料的代表性和可比性 3.整理资料 任务 整理原始数据,使其系统化、条理化,以便进一步计算指标和分析。

原始数据的检查与核对 (应在现场调查完成) ① 统计数据的常规检查。

② 数据的取值范围检错。

③ 数据间的逻辑关系检错 数据的分组设计和归纳汇总(按资料的性质和数量特征分组) ① 质量分组:按事物的性质或类型分组,这种方法多适用于分类变量资料或等级资料。

② 数量分组:按观察值的大小进行分组,这种方法多适用于数值变量的资料 4.分析资料 任务 按研究设计的要求,结合资料的类型计算有关指标,阐明事物的内在联系和规律。

包括 ①用一些统计指标、统计图、统计表等方式表达和描述资料的数量特征和分布规律(不涉及由样本推论总体的问题)。

②对样本统计指标作参数估计和假设检验,并结合专业知识解释分析结果,目的是用样本信息推断总体特征。

4) 统计学的几个重要概念 1.同质与变异:①研究对象具有相同的背景、条件、属性称为同质;

②同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异。

③统计学所研究的对象是以同质为基础,并具有变异的事物或现象。

2.总体与样本:①总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。

②样本:从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本。

3.参数与统计量:①参数:指总体指标,如总体均数、总体率、总体标准差等。

②统计量:指样本指标,如样本均数、样本率、样本标准差等 4.误差:医学科学研究中的误差通常指测量值与真实值之差,其中包括系统误差和随机测量误差;
以及样本指标与总体指标之差,即抽样误差。

5.概率与频率:①概率是对总体而言,频率是对样本而言。

②概率:指某随机事件发生的可能性大小的数值,用P表示,0≤P≤1。

P越接近于1,表明某事件发生的可能性越大;
P越接近于0,表明某事件发生的可能性越小 ③频率:指一次实验结果计算得到的样本率。

P≤0.05或P≤0.01称为小概率事件。

二、 统计描述 1) 数值变量资料的统计描述 1.频数表 ①将所有观察结果的频数按一定顺利排列在一起便是频数表 ②编制频数表的主要目的,一是简化数据,二是便于考察观察结果的分布特征。

③定量测量结果通常不列出各测量值的频数。此时,应将所有测量值中最小值与最大值之间的范围划分成若干等长度的组段,以各个组段内的变量个数作为频数。

2.频数分布图 以评分组段为底,相应频数为高作一系列的矩形。频数分布图又称直方图,它能直观地反映连续变量各种取值出现的机会 3.描述集中趋势的指标 ①算术均数:当资料服从对称分布时,统计中常采用算术均数描述其平均水平(或集中趋势) ②中位数:指一组由小到大顺序排列的观测值中位次居中的那个观测值。全部观测值中大于和小于中位数的观测值的个数相等,各占总例数的 50% ③几何均数:是描述偏态分布资料集中趋势的另一种重要指标。尤适用于描述以下两类资料的集中趋势:
❶等比资料 ❷对数正态分布资料(有些正偏态分布的资料,原始数据经过对数转换后服从正态 分布) 4.描述离散趋势的指标 ①方差与标准差 ②极差 ③百分位数 ④变异系数 2)分类资料的统计描述 1.频数表:分类资料的变量值是定性的,表现为互不相容的属性或类别。在一个样本中,相同情形出现的次数称为频数,将互不相容的各种情形的频数用统计表的形式列出来就是频数表。

2.相对数:包括比例和率 三、 统计表和统计图 1)统计表 统计表是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。

1.统计表的结构包括标题、标目、线条、数字等部分,有些统计表还有备注。

2.制表原则和要求 ①制表原则:重点突出,简单明了 ②制表的基本要求:
❶标题:概括说明表的内容,位于表的上方,内容简洁扼要。

❷标目:用以指明表内数字含义,横标目为主语,表示被研究事物;
纵标目为谓语,表示被研究事物的各项统计指标。

❸线条:除必需的顶线、底线、标目线以外,应尽量减少其他不必要的线条,不使用竖线、斜线。

❹数字:一律使用阿拉伯数字,应准确无误;
同一指标的数字的小数位应一致,位次对齐。

2)统计图 统计图是通过点的位置、线段的升降、直条的长短和面积的大小来表现事物的数量关系。其特点是直观、形象、利于对比等。

1.制图的基本要求 ①根据资料的性质和分析目的,选择合适的图形。

②统计图要有标题,位于图体下方的中央位置。

③绘制有坐标轴的图形,纵、横轴要有标目,标注原点、尺度、单位等,纵横轴的比例以 5:7 为宜。

④同一张图内比较不同事物时,须用不同颜色或样式的线条区别表示,并附图例说明。

2.常用统计图的类型 ①版权所有领考网校 直方图:直方图主要用于表示连续变量的频数分布情况,图中直条连续排布,各直条宽度代表各组段组距,直条高度代表相应组段频数或频率。通过下图 5-5 可直观地了解 ②折线图:折线图用于描述一个变量随另一个变量的变化而变化的趋势和幅度,通常是变量随时间的变化情况。

由下图 5-6 可知 ③误差条图:常用于比较多组连续变量的均值和标准差(或可信区间),直条的高度表示均值,直条顶端用“T”型图标或“工”型图标表示标准差(或可信区间),图标中竖线长度表示标准差的大小(或可信区间范围)。

④箱式图:当连续变量为偏态分布时,用误差条图展示多组间比较不够恰当,可使用箱式图比较多组间的平均水平和变异程度。由图 5-8 可见 ⑤直条图:常用于比较统计指标数值的大小和对比关系,各等宽直条间隔排布,直条高度表示统计指标的数值大小 ⑥圆图:圆图用于表示构成比,圆的总面积为 100%,圆内各扇形区域表示各部分所占比例 ⑦ 百分条图:当要同时比较多组构成比时,采用百分条图比圆图更为直观便捷。百分条图中直条的全长代表 100%,其中每段的长度对应该部分在全体中的占比。如下图 5-12 四、 统计推断 统计推断是用样本信息推断总体特征,包括总体参数的估计和假设检验,它是统计学的核心内容。

1)假设裣验的基本原理 假设检验,亦称为显著性检验,是统计推断的核心,也是实际应用最广的内容。通常把需要判断的总体特征叫做“统计假设”,简称假设,利用样本信息判断假设是否成立的统计方法称为假设检验。

2)假设检验的基本步骤 1.建立检验假设,确定检验水准。

①根据统计推断目的提出对总体特征的假设,检验假设有两种:
❶无效假设,又称零假设,用 Ho 表示。一般将欲否定的假设设为 Ho,它是计算检验统计量的基础。

❷备择假设,用 H1 表示。H1 是与 Ho相互对立的假设,当 Ho被拒绝时,则接受H1。

②确定检验水准:检验水准,也称为显著性水准,符号为 α,是事先确定的允许犯 I 类错误的概率,也是是否拒绝 Ho的界值。

2.选定检验方法,计算检验统计量 要根据统计推断的目的、研究设计的类型和样本量的大小等条件,选用不同的检验方法和计算相应的统计量。

3.确定 P 值,做出推断结论 P 值的含义是指从 Ho所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有样本的检验统计量值的概率。

3)假设检验的注意事项 1.检验方法的正确选择 每种检验方法有其适用的条件,应根据研究目的、设计方案、研究变量的类型、资料的分布、样本大小等进行选择。定量资料符合参数检验条件,应选用参数检验,其中两个独立样本均数比较可用£检验,多个独立样本均数比较可用方差分析;
配对设计资料可用配对设计 t 检验,随机区组资料可用随机区组设计的方差分析等。

2.结果的解释 正确解释“差别有统计学意义”的含义。一般情况,假设检验中 P ≤0.05,称为差别有统计学意义;
P ≤ 0.01,称为差别有高度统计学意义。

推荐访问:流行病学 第五章 统计学 基本知识 医学

《第五章、流行病学和医学统计学基本知识.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

一键复制全文 下载 投诉