论文研究样本量应该怎样计算 在实际中写调查研究的论文如何确定样本量和抽样方法
下面是好好范文网小编收集整理的论文研究样本量应该怎样计算 在实际中写调查研究的论文如何确定样本量和抽样方法,仅供参考,欢迎大家阅读!
1.设计
调查设计是发起一项调查最初的,也是最关键的一步。不仅仅是只有实验研究和临床试验才需要进行严谨地设计,调查同样也需要严谨地设计。不少初学者(例如我)往往会忽略这一步,贸贸然地摘抄几道与主题相关的问题就出去调查,这样得来的结果往往差强人意。所以开始一项调查前,请务必重视设计这一步。调查设计因研究类型而有所不同,这里我们假定题主所开展的研究是现况调查。
1.1 明确目的
明确调查目的是万里长征的第一步。调查目的,即我为什么要开始一项调查,我想了解什么人的信息,我想知道调查对象的什么方面的信息。调查目的影响整个调查的设计与实施。目的不明确,可能会有以下后果:(1)问卷内容七零八落。比如,问卷内容本该涵盖调查对象的一般特征、影响心理压力的因素和心理压力大小。调查目的不明确时,我们所设置的问题针对性不强,可能只覆盖了预定调查内容的80%,也有可能是顾左右而言他,某些条目涉及内容超出了预定范围。(2)问卷条目间的逻辑混乱。条目间清晰的逻辑有助于调查对象理解问题和作答,混乱的逻辑往往会让患者感到丈二和尚摸不着头脑,难以作答。
以本题为例,题主调查目的可以是:调查本市大学生(什么人)的心理压力及其影响因素(什么信息),以期为某市制定大学生心理干预措施提供参考依据(为什么调查)。
1.2 细化课题
过于宽泛的课题,往往涵盖的概念和内容会很多,对于问卷设计者来说,可能会感到不知从何下手,另一方面对于调查对象来说,过多概念带来的过多问题也会带来过长的作答时间,从而使调查对象的依从性大打折扣。细分课题范围,即是在精确化我们的调查内容:调查具有什么特征的人,调查调查对象哪一方面的信息等等。
以题主的课题为例,细化后的课题可以是:调查本市医科大学生(大学生的细化)的学习压力(心理压力的一个细分)及其影响因素。
当然,题主的课题也可以不再细分,因为大学生和心理压力已经是一个相对狭窄的概念,这里仅仅是为方便举例而再作细分。
1.3 调查表设计
调查表设计是调查设计中的一个重头戏。调查表按填写方式的差异可划分为访问调查表(问卷)和自填式调查表,二者的设计原则和技巧基本相同。
1.3.1 调查表构成
在开始设计一个调查表前,我们需要对一份合格的调查表由哪些元素构成有一个清晰的了解。一般而言,主要包括标题、调查项目、编码、填表说明等元素。
1.3.1.2 调查项目
一份调查表短则七、八个问题,多则数十个问题,它们一起组成了这份调查表的调查项目。将它们杂乱无章地堆砌在一起绝对不是一个明智的选择,按照一定规则将它们分门别类,一方面便于自己设置问题条目,另一方面也利于建立清晰的逻辑关系,便于调查对象作答。一般而言,我们可以将其分为以下三个部分:
(1)背景资料
主要是一些人口学项目,如年龄、性别、民族、婚姻状况、文化程度、职业等。
而就本题而言,婚姻状况、文化程度及职业是不需要的,我们可以另外设置专业类别、生源地、单亲家庭与否、独生子女与否等条目。
(2)研究项目变量
即与研究目的有关的调查项目,通常既包括原因变量也包括结果变量,这部分素材是调查表中最实质的内容
就本题而言,原因变量可以理解为大学生心理压力的若干个影响因素,结果变量可以理解为心理压力。针对每个影响因素,我们可以设置一个到多个问题;针对心理压力,我们通常采用心理学量表来测量,根据实际情况可以将原始量表拆分成若干个单独条目放进调查表中,可以以矩阵的形式放进一个条目中;原因变量相关的条目最好紧邻在一起,结果变量同理。
(3)核查项目
调查对象的姓名、现住址、电话、工作单位等,调查员的姓名、调查时间等,主要用于检查资料及进一步追踪。
就本题而言,若不需要进一步进行随访,电话及住址等可以不设置。其他条目是否设置也可以视实际情况而定。
1.3.1.3 编码
即用一个数字代表一个答案选项,便于用计算机进行统计分析。
1.3.1.4 填表说明
即调查表内容的具体说明,它是对调查项目及有关变量的填写给出明确解释和定义,使调查人员和调查对象清楚如何回应调查表中的问题或答案。
1.3.2 条目设计
1.3.2.1 条目的形式
按回答的方式,可以划分为以下三种:开放式问题、封闭式问题、半封闭式问题。
(1)开放式问题:“您认为造成您感到焦虑的因素有哪些?”,若不设选项,让调查对象自由作答,该问题可看作一个开放式问题。
(2)封闭式问题:“您认为造成您感到焦虑的因素有哪些? A.期末考试 B.生活费紧张 C.人际关系紧张”,类似于这样,设置了选项,调查对象只能选择预设的选项。那么该问题则是一个封闭式问题
(3)半封闭式问题:“您认为造成您感到焦虑的因素有哪些? A.期末考试 B.生活费紧张 C.其他______”,类似于这样,调查对象除了可以选择A、B两个选项外,还可以在C项这个开放式选项内自由填入自认为合适的答案。那么该问题则是半封闭式问题。
1.3.2.2 条目编写原则
编写条目时可以遵守以下五条原则:
(1)用词简单直接,通俗易懂;(2)问题清晰明确;(3)避免双重问题和双重否定问题;(4)避免问题的诱导性;(5)注意个人隐私问题。
1.3.2.3 条目排序原则
条目的排序可以遵循以下五条原则:
(1)符合逻辑:问题安排应符合人们的逻辑习惯,如,询问调查对象是否接受过心理咨询和间隔多久接受一次心理咨询,前者是后者发生的前提,故前者应放置在前。
(2)先一般后特殊:将年龄、性别等一般性问题安排在前,与研究项目变量(心理压力及其影响因素)有关的特殊问题安排在后;
(3)先易后难:先安排容易回答的问题,后安排难以回答的问题;
(4)先熟悉后生疏:先安排熟悉的问题,后安排生疏的问题;
(5)妥善安排敏感问题:对于敏感性问题,可以采取尽可能后置问题的方式提高调查对象的依从性,但这类问题较多时,可分散到其他问题中,以降低调查对象的敏感程度和拒答率。
1.3.2.4 设置条目池
答主英语很差,只会来来回回用 many 和 a lot 来表达”很多“,显然是因为答主的词汇量太小,如果答主词汇量足够大,则会懂得用 considerable 或 massive 之类的词来替换,以准确地表达出符合语境的意思。对于调查表中某一个目标调查内容,或许最初拍脑袋想出的那一个条目并不能准确地考察调查对象该调查内容的真实情况,这时,如果我们拥有一个针对该调查内容的条目池,我们就可以从中选择其他候选条目替换原条目,直至新条目能准确合适地考察调查对象的真实情况为止。
在设置条目池时,我们需要先拟定调查表的内容纲要,根据内容纲要建立若干个概念框架,最后基于概念框架设计、收集和整理条目。
1.3.3 调查表制定的步骤
1.3.3.1 拟定调查表的内容纲要
1.3.3.2 确定调查项目
1.3.3.3 编写问卷及安排条目顺序
1.3.3.4 预调查及修改
将拟定好的调查表在小范围内进行预调查,并对调查表的适用性进行初步评价及进一步修改完善。
调查表的评价主要从效度和信度两方面进行。效度主要指的是调查表所反映调查对象的情况与调查对象的真实情况的符合程度。信度主要指的是相同条件下对同一调查对象重复调查结果的一致程度。效度和信度的详细介绍可以参见相关文献,这里就不赘述。
1.4 抽样方法选择
说了很多,终于说到抽样这个正题上来了。一般而言,抽样可分为随机抽样和非随机抽样两大类。
1.4.1 非随机抽样
(1)偶遇抽样:偶遇抽样也叫方便抽样,就是按调查者的方便,而任意抽选样本。通俗地说,就是碰到谁采访谁。
(2)立意抽样:立意抽样就是依据调查者的主观判断来选择样本。
(3)配额抽样:配额抽样也叫定额抽样,就是根据现有的情况,按照一定的比例或者标准确定样本的数额,然后由调查人员在已确定的数额内任意抽取样本。
(4)滚雪球抽样:滚雪球抽样是指对调查总体情况不了解,调查对象无法确认,甚至无法联系时,往往采取先寻找单个调查对象,在对单个调查了解的基础上,再由此调查对象帮助寻找下一位类似的被调查者。
(5)空间抽样:对于边界模糊、变动性大的总体可采用空间抽样。空间抽样一般是在事情发生时,由若干研究者同时对总体进行抽样与调查。这种总体虽然是变动的、不稳定的,但在空间上是有限的。
(6)饱和抽样:饱和抽样是研究者需要对总体包括的所有成员的某些行为进行描述时,使用的一种专门的方法。当总量数量少并局限于一个地区时,这种方法是可取的。
1.4.2 随机抽样
(1)单纯随机抽样:单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。通常总是“三部曲”:事先确定“规则”,将调查总体的全部单位编号,然后借助抽签或随机数字抽样……例如,调查某中学学生的血红蛋白(Hb)含量,在全体500名学生中,随机抽取10%,即抽取50人,为使每一位同学有同等的概率被抽到,实现的步骤如下:先将全校同学按点名册从1,2,3,…,500编号;然后通过计算机依次产生500个在(0,1)上均匀分布的随机数,第一个产生的随机数对应第1号学生,第二个随机数对应第2号学生,依此类推,直至第500号学生;最后,对随机数从小到大排序,则前50个随机数所对应的50个对象即为所抽取的对象。
(2)系统抽样:系统抽样先要将调查总体的全部单位排序,随机抽一个单位为起点,然后依次每隔若干个单位抽取一个单位……其抽样间隔=(总体单位数/样本含量)。
(3)分层随机抽样:先将总体中所有观察单位按主要特征(如年龄、性别、病情等)分为若干层次,然后在各层次中进行随机抽样。
(4)整群抽样:整群抽样是以群体为基本单位的抽样方法。如调查某地区居民的健康状况,抽取的是该地区若干个县的全体居民。
(5)多阶段抽样:将整个抽样过程分成若干个阶段进行的抽样方法称为多阶段抽样。多阶段抽样的具体作法是:先将总体划分为若干个群,这些群被称为初级(一级)抽样单位,然后,用某种抽样方法抽取一部分初级单元;再将抽到的各个初级单元分别划分为若干个次级(二级)抽样单元,用某种抽样方法从抽到的各初级单元中再分别抽取一部分次级单元;……如此下去,直到无需再划分为止。
1.4.3 方法选择的标准
一般而言,为使结果更具有代表性,优先选择随机抽样,在随机抽样中,根据抽样误差的大小又可分出这样的优先次序:分层随机抽样>系统抽样>单纯随机抽样>整群抽样。现实往往比理想骨感,有时随机抽样可能会难以开展,此时选择非随机抽样也无可厚非。就本题而言,可考虑采用多阶段抽样或分层抽样。
1.5 样本量计算
针对实际情况和统计学分析要求的不同,样本量计算会千差万别。这里,我们仅针对”估计总体参数时样本含量估计”这种情形作简要介绍。
1.5.1估计单组的总体平均值
就本题而言,如果采用压力相关心理量表评分作为主要结局指标(下文有介绍),总体参数指的是全市大学生(即总体)的心理量表评分平均值(即参数),估计总体参数即是根据抽样调查得出的样本大学生心理量表评分均数去推测全市大学生心理量表评分均数所在的范围。
在计算样本量之前,我们需要先了解以下信息:(主要结局指标的)允许误差δ、(主要结局指标的)总体标准差σ、置信度1-α。一般而言,允许误差δ是事先根据既往文献或预调查结果确定的,具体方法可以参见《假设检验时样本含量估计中容许误差δ的合理选取》;置信度则是根据我们事先确定的检验水准α而敲定,α多取0.05,故置信度一般是0.95。
根据总体标准差是否已知,样本量计算的公式会有所区别。若总体标准差σ已知,则样本量 n=left( frac{Z_{alpha/2}sigma}{delta} right)^{2} 。 Z_{alpha/2} 是在α的水准下的标准正态分布的双侧临界值。
若总体标准差未知,则用样本标准差S代替总体标准差σ,用 t_{alpha/2} 代替 Z_{alpha/2} ,于是有样本量 n=left( frac{t_{alpha/2}S}{delta} right)^{2} 。 t_{alpha/2} 是在α的水准和相应的自由度df下的t分布的双侧界值,上述式子中 t_{alpha/2} 的求值涉及迭代计算,这里不详述。
1.5.2估计单组的总体概率
就本题而言,若采用压力相关躯体症状出现率P(频率)作为主要结局指标,总体参数则指的是全市大学生的压力相关躯体症状的出现概率π,估计总体参数即是根据抽样调查得出的样本大学生的压力相关躯体症状出现率P去推测全市大学生压力相关躯体症状出现的概率π及该概率所在的可能范围。
在计算样本量之前,我们需要先了解以下信息:(压力相关躯体症状出现率的)允许误差δ、样本的压力相关躯体症状出现率P、置信度1-α。
根据总体概率π(或样本频率P)是否接近0.5,样本量估计公式有所区别。
当π(或P )接近0.5时,则 n=left( frac{Z_{alpha/2}}{delta} right)^{2}Pleft( 1-P right) ;
当π(或P )接近0或1时,则 n=left{ frac{57.3Z_{a/2}}{arcsinleft[ delta/sqrt{Pleft( 1-P right)} right]} right}^{2} 。
当P 未知时,可采用下述公式计算: n=0.25left( frac{Z_{alpha/2}}{delta} right)^{2} 。
1.5.2计算样本含量的工具
PASS、SAS、EXCEL等软件都可以用于计算样本量。SAS需要掌握一些SAS的编程语言,PASS直接输入相应参数的数值即可,EXCEL则需要自行在软件内构建计算公式,度娘一下应该可以找到已经构建好公式的EXCEL文件。
此外,还有一些在线网站提供样本量计算的服务。如(中)和(英)。
1.6 统计分析规划
1.6.1 确定评价指标
在形成研究报告或论文时,我们往往只用一个到数个事先规定的指标来评价我们所关注研究项目的情况。一般而言,我们可以将评价指标根据重要性分为两类:
(1)主要结局指标:主要结局指标一般只有一个,是事先规定的最重要的结局指标,通常以此为准来计算样本量;
(2)次要结局指标:一项研究中除主要结局指标外还可以有几个次要结局指标,但最好不要太多。以肿瘤的预后研究为例,判定某个肿瘤预后好坏的主要结局指标是5年生存率(指接受治疗后5年内患者的生存率),而次要指标则是各类肿瘤标志物。就本题而言,不需要采用次要结局指标,仅采用心理学量表评分作为本研究的主要结局指标。
1.6.2 确定分析计划
做完实验后才找统计学家,就好像要他作尸体解剖。他会说,这实验“死”于什么原因。
出自R. A. Fisher的一句话,也是统计学老师常常跟我们提起的一句话。若在研究开始前没有备好一份统计分析计划,到数据出来时才临阵磨枪,匆忙分析,则往往会生出各式各样的统计学错误,白白浪费了辛苦收集的大好数据。因此,在开始一项调查前,对于分析什么和如何分析,我们应该要有一个清晰的认识。
(1)统计描述:统计描述主要描述的是基线资料、原因变量及结局变量的分布情况。对于计量资料(定量变量),则描述其集中趋势及离散趋势。对于计数资料(定性变量),则描述其相应水平的频数及频率。
(2)统计推断:主要包括参数估计和假设检验。在现况调查的统计分析中,我们可以用到的假设检验方法有Z检验、t检验、方差分析、卡方检验、Wilcoxon秩和检验等等。这些方法都属于单因素分析的方法。
(3)多因素分析:在调查的实施过程中,我们的研究变量可能会受到在研究实施过程中难以控制的各种混杂因素的影响。到统计分析阶段,我们所采用的各类单因素分析方法无法控制混杂因素的影响,此时则需要求助于多因素分析的方法。在现况调查的统计分析中,常用的多因素分析方法有多重线性回归、多重Logistic回归以及对数线性模型。
请注意,各类单因素和多因素分析方法都有一定的应用条件,若不满足则不可使用,即使强行使用这些方法进行分析,得出的结果也不具代表性和可信度。若各类单因素和多因素分析方法都不可用,此时对资料进行简单的统计描述即可。
就本题而言,我们需要先对基线资料、原因变量、结局变量相关条目进行单因素分析。在进行单因素分析前,我们先要考察基线资料的均衡性,即分析某一变量不同水平的基线是否相当。若不均衡,需要采用分层、匹配及回归的方法进行统计学处理。在多因素分析阶段,我们将以基线资料和原因变量为自变量,以结局变量为因变量,建立多重线性回归模型或多重Logistic回归模型,以此来筛选出心理压力的影响因素。
2.实施
2.1 调查实施步骤
(1)发现和提出问题;
(2)复习文献;
(3)立题;
(4)调查设计;
(5)预调查;
(6)收集数据资料(正式调查);
(7)整理、分析阶段;
(8)解释和交流研究结果(发布论文)。
2.2质量控制
并非有了良好的设计就一定能保证调查工作的高质量。要保证质量贯穿在调查研究的每一个环节之中,现场调查阶段、资料整理和表达以及统计分析阶段都要进行严格的质量控制。
2.2.1现场调查的质量控制
现场调查的质量控制主要包括以下几个方面:
2.2.1.1 选择和培训调查员
(1)调查员的类型:可分为对调查内容及目的有一定预备知识者和对调查内容及目的没有预备知识者,前者较易培训,调查可以做得比较深入,但调查时容易不自觉地使用提示性语言,以致造成偏倚,而后者不易发生以上偏倚,但培训起来较困难,调查方式呆板,不懂得更深入的调查。现场调查时,根据招募的调查员类型,针对性地采取质量控制措施,如针对前者加强监督和工作质量评估,针对后者加强培训等。此外,招募调查员时,宜选择认真负责、责任心强、积极性高的调查员,以减少调查工作中产生的偏倚。
(2)调查员的培训:培训宜集中进行,培训内容为:了解调查内容,统一调查方法,熟悉调查的技巧等等。在培训时告诫调查员,调查时应尽量避免采用提示性语言或告知被调查者应如何回答。若调查内容涉及被调查者的隐私,则需要告知调查员要恰当地打消被调查者的顾虑,或教授调查员特殊的调查技术。
(3)录音机调查:为了避免由于调查员的暗示而造成偏倚,可尝试用录音机来代替调查员进行调查,即先拟好问题的标准提法,制成磁带,由调查员放给被调查者听,被调查者根据录音机所提的问题回答,调查员原则上不作解释。
2.2.1.2 开展预调查
开展预调查的过程中注意思考以下几方面的问题:
(1)调查表是否合理:如是否有未考虑到的问题、调查项目的分类是否合理、问题提法是否明确和通俗易懂、问题提法是否客观、问题的选择性答案是否过细或过粗、调查表的结构是否合理;
(2)被调查者的合作程度:尽量取得被调查者的信任,尤其是调查内容会涉及被调查者隐私时,此外可借助调查现场管理者的行政手段、宣传调查的意义等方法,最大限度争取被调查者的合作;
(3)调查计划是否可行:调查时间的安排是否恰当,尽量避免在被调查者用餐、会客或特别忙时进行调查;调查内容是否会过多或过少;注意预算是否合理,调查经费主要包括调查员的培训费、交通费、住宿费、调查补助费、通信费、设备租金以及用于数据质量控制的复核费用等;
(4)现场可能发生的意外情况及其应对预案:调查组织者和设计者最好在开展预调查时亲自到现场向被调查者,负责当地管理的行政人员以及调查员了解现场情况。
2.2.1.3 制订质量控制方案
在现场调查时,可考虑从以下方面着手制订一份质量控制的方案:
(1)制订质量核查制度并严格执行
(2)制订调查的规范化操作指南,有利于减少来源于调查员的调查误差。
(3)设计质量控制表,细化到调查中的每一步,每日根据质量控制表对当日的调查工作进行评估
(4)每日对调查资料进行审核,发现问题后及时进行重调查或跟被调查者确认
(5)每日的调查工作都做好详细记录(包括异常情况、发生的问题及解决措施等)
(6)根据现场发现的问题及时对调查方案进行调整
2.2.1.4 重复调查
重复调查是指原调查结束一段时间后,抽取一定量的被调查过的对象,再进行一次调查,根据两次调查的符合程度,来评价调查的质量。重复调查可用原调查表,也可是简化的调查表,简化时应该注意该简化调查表应该包括所有重要项目,且问题的提法和答案的粗细程度应与原调查表一致,以便进行比较。
两次调查应有一定的间隔,以避免滞后效应,一般情况下,间隔时间以一周至一个月为宜。重复调查的人数没有一定的规定,一般可以是原调查人数的5%~10%。重复调查往往不易取得被调查者的合作,应注意做好解释工作,最大限度争取被调查者的理解,必要时可改变调查的名义。
2.2.2 资料整理、表达与统计分析的质量控制
(1)人工审核
主要检查明显错误和数据的不一致
(2)编码
将问卷上的文字信息转换为数字编码
(3)用计算机对调查资料进行逻辑检错
逻辑检错指检查调查表中的答案前后是否一致,是否有相互矛盾之处。目前,BMDP、SAS、APSS均有逻辑检错功能,此外,也可编写BASIC语言程序进行逻辑检错。对于逻辑检错中查出有错误的记录,应首先核对一下,录入有无错误,如不是录入错误,则可根据具体情况,采取重新调查核实或剔除等措施。
(4)双人录入
保证数据录入的准确性,最好采取双人录入的方式,然后进行双份资料的逻辑检查,只有完全一致的数据才能进入统计分析。
(5)选择恰当的统计分析方法处理调查资料
(6)合理解释分析结果
(7)将重复调查和原调查结果加以比较
针对不同的资料类型可采用不用方法对数据质量进行评价。计量数据可通过“个体内相关系数”进行评价,计数资料可通过Kappa系数进行评价,等级资料可通过Kendall相关系数进行评价。
2.3 偏倚控制
当某一研究结果与其客观真值之间出现了倾向性的偏差,即测定值要么都高于其真值,要么都低于其真值,这种偏差叫作系统误差,也叫作偏倚或偏性。在调查研究中,常见的偏倚有选择偏倚、信息偏倚和混杂偏倚。
2.3.1选择偏倚
是指由于在选择调查对象时(包括病例和对照组、暴露和未暴露组)方法不正确或研究对象不合作所造成的偏倚。此类偏倚常包括以下5种情形:(1)伯克森偏倚(入院率偏倚);(2)奈曼偏倚(现患-新发病例偏倚);(3)无应答或错应答偏倚;(4)检测偏倚;(5)失访偏倚。
针对不同情形的选择偏倚会有不同的控制措施,可参见相关文献,这里不详述。
2.3.2 信息偏倚
即所提供的信息是不真实的所造成的偏倚。控制信息偏倚的方法:主要是提高调查技巧和质量控制。
2.3.3 混杂偏倚
即由混杂因素导致的错误信息。控制混杂偏倚的方法:在调查设计阶段,可通过选择对象的限制法(即制定纳入标准和提出标准)和匹配法(确定合适的配对条件,采用配对设计)来控制混杂因素的影响;在统计分析阶段,可利用标准化率、分层分析、协方差分析和多重线性回归分析或多重Logistic回归分析等方法,减少混杂因素对结果的影响。
2.4 伦理问题
调查研究中所涉及的伦理问题主要有知情同意和隐私保护两类。当在调查中,涉及一定的伦理道德问题时,必须让调查对象知情同意,必要时需要调查对象在知情同意书上签字。此外,研究人员有责任保护调查对象的个人隐私信息,主要的形式有匿名和保密两种。
再次更新: