加载中........
×

史上最全!手把手教你问卷与量表的编制及分析

2019-2-28 作者:不详   来源:网络 我要评论1
Tags: 医学人文  

01

问卷与量表的差异

「问卷与量表」都是研究者用来搜集数据的一种技术,也可以说是对个人行为和态度的一测量技术。它的用处在于量度,特别是对某些主要变项的量度。虽然问卷和量表都是可以用来搜集数据,但这两者基本上还是有一些差异存在的:

? 在编制架构上的差异

1. 量表需要理论的依据,问卷则只要符合主题即可

通常量表的编制都是根据学者所提的理论来决定其编制的架构,譬如若要编制教练的领导行为量表时,可根据运动心理学者Chelladurai & Carron的运动情境领导理论来编制。此项理论将教练的领导行为分为「训练和教学的行为」、「民主的行为」、「权威的行为」、「社会支持的行为」及「奖励及赞赏的行为」等五个向度,因此编制者可依照这五个向度编成一份有五个分量表的领导行为量表。然而在编制问卷时,只要研究者先将所要研究的主题厘清,并将所要了解的问题罗列出来,然后依序编排即可。

2. 量表的各分量表都要有明确的定义,问卷则无此要求

在编制量表时,若没有分量表,编制者就直接将此量表的定义加以说明。若所编制的量表包含有若干个分量表,各个分量表亦需将其定义加以界定清楚。一方面让编制者在编题时能切合各个分量表的主题,另一方面是让阅读者能了解此量表的各个分量表究竟是做何解释。

? 在计分上的差异

1. 量表是以各个分量表为计分的单位,问卷是以各题为单位来计次

假如一个量表有若干个分量表,其计分的方式是以各个分量表为单位。由于量表通常是以点量尺的型式呈现,研究者只要将分量表中每一题的分数相加即可。问卷则和量表不同,它是以单题为计算单位,亦即是以每一题的各个选项来计算其次数。

2. 量表的计算单位是分数,而问卷的计算单位是次数

由于量表是将各题的分数相加而得到一个分数,因此所得的分数是属于连续变量。而问卷是以各题的选项来计次,所得的结果是各个选项的次数分配,此乃属于间断变数。

? 在统计分析上的差异

1. 量表在描述统计方面有平均数、标准差、积差相关;在推论统计方面有t验验、变异数分析、共变量分析、迥归分析等。

2. 问卷在描述统计方面有次数分配、百分比;在推论统计方面有χ2考验(如适合度考验、百分比同构型考验、独立性考验、改变的显着性考验等)。

02

问卷编制的方法

? 问卷编制的步骤

研究者在编制问卷时,可依三个步骤进行:确定主题、搜集数据、编制题目。

1. 确定主题

问卷编制的内容应和所要调查的目的一致,譬如若要了解台北市民参与慢速垒球活动的情形,所编制的题目就应和慢速垒球的活动有关。

2. 搜集资料

假如要了解市民参与慢速垒球活动的情形,首先需要知道台北市的慢速垒球活动是如何运作。编制者可至台北市慢速垒球协会访问相关的工作人员,或是至垒球活动的现场了解会员参加活动的情形。这些数据都可供编制者在编制问卷时参考用。

3. 编制题目

编制者在搜集有关的资料后,即可将各项资料整理并编拟出题目。所编的题目可分为人口统计变项部份和问卷题目部份两类,由前者可了解参与慢速垒球活动人员的年龄、性别、婚姻、职业、学历、收入等基本资料,问卷的主要内容包括有参与慢速垒球活动的原因、每月参加的次数、时间、经费、及参加的方式等。

? 问卷编制的类型

一般而言,问卷的类型可为开放式的问卷和封闭式的问卷两类。以下即分别予以说明:

1. 开放式的问卷

在球类运动中,你喜不喜欢棒球?为什么?

你通常收看什么球类比赛节目?为什么?

2. 封闭式的问卷

你喜不喜欢棒球运动?

囗很不喜欢  囗不太喜欢  囗有点喜欢  囗很喜欢

你通常喜欢收视那种球类比赛节目?

囗篮球  囗足球  囗棒球  囗其它

由上面的例题得知,开放式的问卷让作答者有较大发挥的空间,研究者可以比较深入的了解作答者心中的想法,但需要较长的时间作答。而封闭式的问卷的优点是让作答者能在最短的时间内作答完毕,而且答案明确,易于统计,但其缺点是无法得知作答者为何要选该答案的原因。通常一份问卷是以封闭式的题目为主,另佐以若干开放式的题目(研究者比较想深入知道的问题)。

? 提出问题的标准

研究者在编制问卷时必须先考虑所编拟的问题是否适宜,以下所提的几项标准可作为问卷编制者的参考:

1. 问题是否与研究目的一致

问卷里所提的问题必须和研究目的一致,才不会让作答者有离题的感觉。譬如问卷是要了解市民参与慢速垒球活动的情形,所有问卷里的问题当然都必须和慢速垒球活动有关。假如在此份问卷里问了有关台北市政的问题,就会让作答者不知所措。

2. 问题的类型是否合适

有些问卷的问题适合用封闭式的类型,有些则应该用开放式的类型。一般而言,开放式的问题比较能获得充足的数据,但其缺点是费时,而且作答的对象在教育程度上不能太低。因此,问题的类型应该视作答的对象、研究的主题、可以应用的时间等因素而定。

3. 问题是否令人难以回答

在问卷里应避免提出让人不喜欢回答的问题,像诸如此类的问题都非常敏感,即使有这种想法的人很可能也不会据实回答。

4. 问题是否涉及个人的稳私

有关个人隐私的问题,编制者应该尽量避免将其列入,除非这是研究者研究的主题,而且事先获得作答者的合作,否则这种问题是不可能得到真正的答案。

5. 问题是否有暗示作用

问卷的问题不应暗示作答者做某种的回答,当然会强烈的暗示作答者选择不同意的答案。

6. 问题是否超出作答者的能力

问卷所问的问题应视作答者的能力来提问题,像此类的问题已超出作答的能力范围,将会使作答者无法反应。

? 编制题目的原则

1. 用字浅显易懂

题目的文词应力求清楚明了,不要造成作答者对语意的误解。而且用字也要简单易懂,尽量使作答者能节省作答的时间。

2. 每个问题只涵盖一个观念

一个句子只能提及一个观念,以免作答者混淆。譬如「当你遇到挫折时,你是否会努力不懈而且尝试用新的方法去解决。」这个句子就涵盖了「努力不懈」及「尝试用新的方法」两个观念,有时作答者只符合了其中的一个观念,这对于作答者将会造成困扰。因此像上述的例子最好将其改为两个句子:「当你遇到挫折时,你是否会努力不懈去解决。」及「当你遇到挫折时,你是否会尝试用新的方法去解决。」

3. 避免主观及情绪化的字眼

问卷的问题应该是采用客观、中性的字眼,不应用会挑起作答者情绪的文字,如「你认为教育部不准大学的体育教师上课是否有打压体育教师的嫌疑?」,这个句子所用的「打压」这个字眼就非常不适当。

4. 问题的选项应清楚界定

问卷里各个问题的选项应界定清楚,选项因为有重迭的情形出现,将会造成作答者无法正确的作答,这是编问卷者要避免的情形。

5. 不用假设或猜测的语句

假设性的问题,因为作答者有太多的想象空间,以致于所得的结果不易归纳解释。在实际的应用上,价值并不高。

6. 句子避免过长

通常作答者在填答一份问卷时,都不希望花太多的时间,假如问卷的题目简单清楚,一目了然,作答者的配合度会较高;反之,若题目复杂又冗长,作答者有可能会应付了事。冗长的题目,只是浪费作答者的时间而已。

03

量表编制的方法

? 量表编制的步骤

1. 拟定编制量表的计划

当研究者决定编制一份量表时,首先须拟定编制量表的计划。此份计划包括决定应搜集哪些相关的数据、编制的进度、样本的选取、经费预算、编制完成所需的时间等。

2. 搜集资料

不同的量表所涉及的数据当然就有所不同,譬如选手的「成就动机量表」和教练的「领导行为量表」,在文献的搜集上当然有很大的差别。编制者必须先了解量表的性质,然后才决定所搜集资料的方向。如成就动机量表是属于人格方面的量表,编制者就要从人格心理学的理论或既有的量表中去搜集。若是领导行为量表,因其是属于社会心理方面的量表,编制者就要在社会心理学中去搜集。

3. 拟定量表的架构

编制者可以参考某一个学者的看法,或是综合数个学者的理论拟出所要编制量表的架构。假如此量表有若干个分量表,编制者应先将其定义写出来,以利尔后编制题目之用。

4. 编制题目

当量表的架构定出来之后,编制者即可参考所搜集来的其它的量表资料来编题。通常为了将来有删题的空间,编制者大约要比预定的题数多编二分之一的题目。如一个分量表若需要10题,此时就需编15题。

5. 预试

当题目编好后,编制者即需进行预试。亦即编制者要找一些受试者先对此份量表试作,以了解那些题目是可用的。预试的样本至少应有200人,以利以后的项目分析之用。

6. 项目分析

项目分析的主要目的是针对预试的题目加以分析,以作为正式选题的参考。进行项目分析时,通常有两种方法可以使用,第一种方法是用t考验法,第二种是用相关法。在做项目分析时,这两种方法都是以单题为单位来进行分析。以t考验而言,在进行项目分析时,是以该分量表总得分的高分组(前25%的受试者 )和低分组(后25%的受试者)在每一题得分的平均数进行差异比较。所得的值称为决断值,必须高于查表的临界值,才具有鉴别力,有的学者建议CR值至少应达3以上为佳。在进行相关法时,有两种方式,一种是含本题在内所得的相关,另一种是不含本题在内的相关。进行第一种相关法时,首先将每个受试者分量表的总得分算出来,然后以题为单位,计算每一题与总得分的相关。一般而言,相关系数至少应达0.4以上为佳。进行第二种相关法时,以每一题和该题所在的分量表的总得分(不含该题)求相关。一般而言,相关系数应达显着水平才算是具有鉴别力的题目。

7. 编制正式题目

编制者可根据项目分析的结果来进行选题,只要鉴别力合乎标准的题目都可以选为正式的题目。若项目分析所得各题的决断值都合于要求,则由高而低选出预定要的题数。

8. 建立信度与效度

一份好的量表必须具有相当的信度和效度。所谓信度即是指可靠的程度,而效度则是指有效的程度。有信度的量表通常具有一致性、稳定性、可靠性、及可预测性等。一份稳定可靠的量表,几次所得的结果一定是相当一致的,而且可透过此量表对受试者做预测用。

效度是指一个量表能够有效的测量到它所要测量的特质的程度,譬如一份有效的「成就动机量表」应该能确实反映出受试者的成就动机,高成就动机者在此量表的得分应该比低成就动机者的得分显着要高。

量表的信度和效度应该如何建立,在下面部份即会有详细的说明。

? 如何拟定量表的架构

1. 决定量表的因素

一个量表究竟需要多少个分量表,主要是视所根据的理论而定。譬如Chelladurai & Carron的运动情境领导理论将教练的领导行为分为五个向度,这五个向度即可成为五个分量表。若是属于探索性的研究,并没有理论的基础,则其因素的多寡就需要用探索性的因素分析来决定。一般而言,若抽出的因素其特征值大于1的话,此项因素即可保留。

2. 订定正式量表的题数

一份量表究竟需要多少题,并没有一个定论。大约有几个指标可供参考:可用的时间(时间越长,题目就可越多)、所测特质的灵敏度(较不灵敏的特质通常需要较多的题目,才能区分出不同的群体)、分量表的多寡(分量表越多,所编的题数就会随着越多)。

3. 决定预编的题数

预编的题数通常都要比正式的题数多一些,对于常常编制量表的专家而言,预编的题数大约比正式的题数稍多几题即可。如正式的题数若定为10题,则只要预编12或13题就可供筛选。但对于初学的编制者而言,最好多编几题,以免有太多不具鉴别力的题目出现。一般而言,预编的题数至少需比正式的题目多编一半的题目。

4. 决定量表的量尺

通常量表的量尺以五点或四点的型式为多,如五点量尺为「非常同意、同意、没意见、不同意、非常不同意」,四点量尺则将「没意见」去掉。究竟五点量尺或是四点量尺较佳,学者们各有不同的意见。有的学者认为比较不认真作答的人会有选「没意见」的倾向,结果造成所得的数据没有太大意义,因此以四点量尺较能看出作答者的态度。而有的学者则认为四点量尺有强迫作答者表态的意思,事实上有的问题是作答者所不了解的,「没意见」一项还是值得保留。这两种量尺都各有其优缺点,编制问卷的人可视其需要而采用其中的一种。有的学者将量表分成六点、七点,或甚至九点的量尺,因为人类的感觉知觉并不是那么灵敏,将量尺分得太多类,其实并没有太大的意义。

其次,有的学者认为将量尺分为「非常同意、同意、没意见、不同意、非常不同意」或是「非常同意、同意、不同意、非常不同意」,然后用加权计分可得分量表的总分。如在五点量尺时,非常同意得5分,同意得4分,以下以此类推。可是事实上,从非常同意至非常不同意之间并不是等距变量,而是次序变量。如非常同意至同意之间的距离,并不等于同意至无意见之间的距离。因此,在语意上不等距的情形下,予以等距的加权计分,并不符合统计的原则。

? 信度的考验

1. 稳定性系数(重测信度)

重测信度是用同一批受试者做同一份量表,然后以前、后两次测验的分数做积差相关。通常两次测验的间隔多以两周为度,有的量表甚至因其需要也有高达一个月或数个月的情形。两次测验的相关若越高,则代表其越具有稳定性。一般而言,.7~.9是属高相关,.4~.6是属中度相关,而.3以下则是低相关。

2. 内部一致性系数(Cronbach α、折半信度)

假如所得的Cronbach α系数越高,则代表其测验的内容越趋于一致。其次,内部一致性系数还可用折半信度来求得,但由于折半信度是将题目分成两半分别求得两个总分(通常是分为奇数题和偶数题),然后再以积差相关求两个分数的相关。由于题目被分为两半,常会造成信度偏低的现象。因此,需要再加以校正。较常用的校正方法有斯布(Spearman-Brown)、福乐兰根(Flanagan)、卢隆(Rulon)等校正公式。

? 效度的考验

1. 效标关联效度

为了要验证所编的量表是否具有效度,最常用的一种方法即是效标关联效度。此种方法是针对所编的量表找一个可参照的效标,假如所得的积差相关系数达中度相关以上(0.4以上),即代表此份量表具有相当的效标关联效度。

一般而言,适当的效标需具有相当的可靠性,否则无法有效预测所编制的量表。如以上述的「运动成就动机量表」而言,若以资深的教练对选手加以评分,所得分数当然可以作为效标。若是资浅的教练,因为对所有的选手还不是非常了解,其所做的评分就不是可靠的效标。

2. 建构效度(团体差异的分析、因素分析)

团体差异的分析:以前述所编的「运动成就动机量表」而言,编制者可请教练从其团队中选出高成就动机及低成就动机的选手,然后以高、低成就动机组的选手在成就动机得分的平均数进行差异性考验。假如高成就动机组的平均得分显着高于低成就动机组的平均得分,即代表此份量表能有效的区别高、低成就动机的选手。

又如考验「运动攻击态度量表」的团体差异性分析,可以比较男、女选手在此量表得分的平均数,若男选手的得分显着高于女选手的得分,即代表此量表具有良好的效度。因为从一般心理学的研究中,男性的攻击性都显着高于女性。因此若男选手的得分显着高于女选手的得分,符合了心理学的研究,可由此说明此量表具有建构效度。

因素分析:因素分析用在效度的考验方面可分为探索性因素分析(exploratory factor analysis)和验证性因素分析(confirmatory factor analysis)两种。当编制者在编制量表而没有理论作为根据时,只是由编制者依其概念将有关的题目编制出来,然后透过探索性因素分析了解所编的题目中究竟含有多少个因素。而当编制者采用某个理论来编制量表时,因为一个理论通常都会包含几个向度,亦即所编的量表相对的也会包含这几个分量表。为了验证此项量表所包含的分量表是否和所用的理论一致,验证性因素分析就可用来考验其效度。

在用探索性的因素分析时,通常量表的编制者并不会预先知道会有几个因素,而是看特征值(eigenvalue)大于1的因素有几个,就决定有几个分量表。此外,虽然在统计软件包(如SPSS)上有多种方法可抽取因素时,但是一般多半用主轴法(principal axis method)。至于在转轴方面,有正交转轴(一般较常用最大变异法varimax)和斜交转轴(oblimin)两种。通常可先用斜交转轴试做,看其各因素之间的相关,若各因素之间是零相关,可改用正交转轴。若各因素之间有低相关(0.1~0.3),当然是用斜交法进行转轴。此时,以斜交转轴所抽取的因素就可加以命名,并将各因素中各题的因素负荷量较小的题目剔除(一般小于0.4的题目可加以剔除),然后重新再跑一次因素分析,直至各因素所有题目的因素负荷量都达到0.4以上。假如是用正交法进行转轴,也是同样的方式,先将各因素命名,然后剔除因素负荷量未达0.4的题目,再重新跑因素分析。

另外在进行探索性的因素分析时,若是编制者综合若干个理论而合成一个量表(其中有几个分量表),此时亦可先用斜交转轴做,但可指定因素的数目。如编制的量表有五个分量表,就可指定以五个因素来做因素分析。因素分析后的各因素间没有相关存在,可改用正交转轴。若各因素间的相关是低相关(0.1~0.3),就以此斜交转轴的结果呈现各题的因素负荷量。若有两个因素间的相关达0.4(含)以上,即表示这两个因素有很大的重迭,应该将这两个因素合并为一个因素,然后再重新做斜交转轴,直到没有因素间的相关达0.4以上为止。

至于验证性的因素分析则是量表的编制者根据某一个理论编出一个量表(其中有若干个分量表),为了验证所编的量表是否符合原先的理论,此时可用验证性因素分析加以验证。在进行验证时,有SPSS的LISREL(linear structural relations)软件包可以使用。譬如所根据的理论若有五个因素,而验证性因素分析所做出来的结果也证明是这五个因素,此时即可说此量表具有建构效度。

此内容来源于百度文库,由量化研究方法编辑推荐并整理。

我们尊重每一位作者的辛勤写作,本文仅作学术分享之用,文章版权归原作者所有。



小提示:78%用户已下载梅斯医学APP,更方便阅读和交流,请扫描二维码直接下载APP

只有APP中用户,且经认证才能发表评论!马上下载

SCI我的梦

谢谢分享

(来自:梅斯医学APP)

2019-2-28 12:33:52 回复

web对话