第十三章 变量分析的一般原则
上一章介绍了对调查资料进行统计分析的具体方法与技术,本章则进一步说明社会调查研究中变量分析的逻辑。分析的逻辑是指分析时所遵循的逻辑方法与推理过程。统计调查的目的一是通过一些变量来描述调查总体和各个部分的状态、特征和一般过程,说明社会现象“是什么”,二是通过对这些变量之间关系的分析采说明社会现象之间的因果联系和一般规律,解释社会现象为什么产生、发展、变化。变量关系分析要遵循一定的逻辑方法,要采取一定的程序。如果不掌握变量分析的逻辑,就有可能面对一大堆统计数据而茫然无措,或者是只简单地列出一些百分比、平均数,除此而外很难再作更深入的定量分析。因此,只有把握了变量分析的逻辑,才能使资料分析更深入、更全面,才能防止某些逻辑错误,使理论解释更符合实际,此外,通过对变量分析思想的把握,还可以培养研究者的想像力和分析能力,从而有效地理出资料的头绪,最大限度地利用资料取得较大的研究成果。
统计调查的变量分析最早是由法国社会学家杜尔凯姆运用到社会研究中来的。以后经斯多弗、拉扎斯菲尔德、罗森伯格等人的发展与完善,形成了一套较系统的统计调查的资料分析模式——详析模式。本章主要是通过对这一模式的介绍来说明目前社会调查研究中变量分析的一般逻辑。
- 变量关系的类别
??? 社会研究的目的主要有四项,即对社会现象作出描述、解释、预测与控制,它们所需要的知识和理论往往涉及到两个或两个以上事物之间的关系。因此,为了达到解释、预测与控制的目的,研究便不能不以事物间的关系的分析为其主要工作。
?一、变量间的关系
变量间的关系是多种多样的,有两个变量间的关系和多个变量间的关系。在很多情况下,多个变量间的关系可以用数个两变量间的关系进行描述,例如图13—1中的一因多果型的关系可用两个变量间的关系加以描述:社会流动的增加导致家庭的不稳定性增加;社会流动增加引起社会偏见增多;社会流动增加使参与次级群体增加。
Y1(家庭不稳定增加)
 X(社会流动增加)???????????? Y2(社会偏见增多)
Y3(参与次群体增加)
图15—1? 一因多果关系
又如图15—2的多因一果型关系也可以分解成三个基本的两变量间的关系。
X1(性关系)
 X2(怀孕)?????????????? Y(社会生育率)
X3(胎儿成活率)
图15—2? 多因多果关系
因此,两变量间关系的研究是社会研究中最重要的内容之一。
就两个变量而言,它们之间可能是有关系的,也可能是没有关系的。如上一章所述,两个变量之间关系的有无和大小以用相关系数进行测量,叫作统计相关或统计无关。两个从统计上看无关或弱相关的变量,实际上可能的确无关,但也可能是有关系的,使两个变量真实关系不能表现出来通常是由于第三个变量的影响,它抑制、取消或削弱了这一真实关系。这种使变量间真实关系隐而不显的变量叫做抑制变量。两变量之间这种统计上无关系而实际上上相关的情况称为虚假关系。两个从统计看具有相关关系的变量,它们之间的真实关系有下列三种可能的情况:
(1)实际上无关;(2)实际上相关;(3)实际上具有因果关系。
二、、统计相关的不同类型
(一)统计相关而实际上无关
这种关系称为对称关系或虚假相关,即从统计上看有关系的两个变量实质上相互独立、互不影响,并无有意义的联系。例如手心冒汗与心跳的关系就是一个对称关系,表面上看两者之间有关系,它们常常同时出现、一起变化,但实际上两者之间互不影响,没有内在的联系。我们不能说手心冒汗引起心跳,或心跳导致手心冒汗。
两变量间的对称关系用符号表示就是:X一Y。
两变量对称关系的发生有时纯属巧合,例如某地区乌鸦的数目与小孩的出生数之间表现出某种关系,即乌鸦多的村子小孩出? 生数目也较高,乌鸦少的村子小孩出生数目也较少。乌鸦数目与小孩出生数目间的这种关系显然纯属巧合,两者间并无内在的联系。有时两变量对称关系的产生是因为这两个变量是同一原因的结果。例如我们发现,家庭不稳定性与社会偏见同时增加,统计上也是相关的,但实质上两者都是社会流动增加的结果,彼此间并无影响。
有时两变量对称关系的产生则是因为这两个变量是同一事物功能互依的两个部分。例如心的存在与肺的存在有关,但并不是心的存在“引起”了肺的存在,或肺的存在“引起”了心的存在,而是因为有机体的各部分具有特定功能;因而使这些器官相互依存。两变量对称关系的产生有时还因为它们实质上是同一概念的不同指标,上面所说的手心冒汗与心跳间的关系实质上是源于两者都是焦虑的表现;或者是因为此两变量是同一体系的不同要素,如嗜烟行为与嗜酒行为似乎有关,即嗜烟的人也多嗜酒,但实际上两者均为某种“生活方式”的要素。它们是柑互独立、互不影响的,两者的统计相关只是由于它们都与一定的生活方式相联系,而不是因为—嗜烟导致了嗜酒,或相反。
(二)统计相关、实际也相关
两变量的这种关系称为相互关系。所谓相互关系是指统计上? 相关的两变量实质上也是有关系的,这种关系是一种交互影响的。在这种关系中,两个变量相互作用、相互加强。例如疏离态度与社会地位的关系:低社会地位使人与社会的价值和制度疏离,而疏离又造成低的社会地位。又如投资与利润的关系;利润多的公司会增加其投资,而新的投资又增加了利润,这又造成再投资。在这两个例子中,我们虽然明知有因果关系存在,却难于指出何者为因、何者为果。
相互关系在调查中极为常见:用符号表示这种关系就是X←→Y。
(三)实际的因果关系
这种情况是指统计上相关的两个变量之间实际上存在着因果关系。因果关系是变量分析中所探讨的最重要的课题。社会研究中所说的因果关系是指在两个变量中,一个变量的变化伴有另一变量的变化,即一个变量影响另一个变量,但反过来不成立。抽烟与肺癌的关系就是一个因果关系,抽烟可以导致肺癌,但反过来肺癌不会导致抽烟。在因果关系中,能够影响其他变量发生变化的变量称为自变量;依赖于其他变量,但其本身不能影响其他变量的称为因变瓢这也是通常我们希望解释说明的变量。
因果关系用符号表示就是:X→Y。
判断因果关系中哪个变量为自变量,哪个为因变量的—般原则有两个:
1.时间先后。由于后发生者无法影响先发生者,因此先发生者一定是自变量。例如父亲的教育水平与孩子对自身的职业选择有关,父亲的教育水平显然是自变量,因为它发生在孩子的职业选择之前。
2.变量的不变性与可变性。时间的因素固然重要,但并不是决定关系方向的不变的标准。例如当一个人生为黑人,处于贫困地位并终生如此时,就很难判断这两个变量时间上的先后。但种族无疑是自变量,这不是因为种族先于贫穷,而是因为种族是不可变的,而收入却是可变的。在社会研究中常将尸些具有田定性、持久性的变量作为自变量,如性别、年龄、民族等;社会研究中还有一些重要的变量,它们只具有相对持久性;如社会地位、居住地及社会阶级等就属于这种类型的变量。这类变量比行为、态度等变量更为固定持久,因而往往被当作自变量。因此,在决定两个变量中哪个为自变量、哪个为因变量时,不变性只是一个相对的概念。
需要指出的是,这里所讲的因果关系也称为非对称关系,即X→Y,它是指在特定条件下的两变量关系中,一个变量影响另一个变量,反过来后者对前者没有影响。这种非对称关系与自然科学所讲的因果关系有一定区别,后者的定义要更严格一些。
第二节 详析模式
? 一、两变量的交互分类
多数的研究都是从两变量间关系的假设开始的,比如说基于某种理论,我们可能会预测女人比男人更不关心政治,或者说社会地位与自信心呈正相关关系。这些假设几乎总是在预测两个变量间的关系。因此,资料分析的第一步就是检验这些假设所预言的这种关系是否存在,即对这种关系的有无和强弱以及它的内部状况进行描述。它回答社会现象“是什么”的问题。对两变量间关系进行描述的最基本的方法是“交互分类”法,又称列联麦。表15—1是一张3×3的列联表,由变量“青年人的教育水平”与变量“最大志愿”交互分类而成。
表15-1? 青年人的教育水平与最大志愿
志愿
(因变量) |
教育水平(自变量) |
合计 |
高 |
中 |
低 |
快乐家庭
理想工作
增广见闻 |
50%
0
50% |
50%
50%
0 |
16.7%
66.7%
16.7% |
40
50
10 |
总计 |
100%(10) |
100%(60) |
100%(30) |
|
通过交互分类,变量之间的关系便呈现了出来。如从上表可以看出不同教育水平对最大志愿的影响情况:教育水平低的最大志愿多为理想工作,教育水平高的则为快乐家庭与增广见闻。
上述描述性分析在统计上指出了两变量间关系的有无和大小。但上一节曾经指出,两个变量在统计上相关与否与实际上是否存在内在的关系并不一定完全一致,因此通过这种描述性分析仍不能回答假母所预言的两变量间的关系是否真实存在的问题。
此外这种描述性分析也无法回答“为什么有这种关系”和“在怎样的条件下或情况下存在这种关系”这样的问题。对这些问题的回答是分析的第二步的任务,即对变量之间的关系和联系程度进行精确的因果分析,以判别关系的真伪、回答这种关系为什么会产生以及说明这种关系存在的条件。为了解释和检验两变量间的真实关系,虽然可以根据已有的知识作出猜测,但更有价值的办法是进行系统的检查。
?
二、引人检验因素??
检验两个变量间关系的最重要、最系统的办法是引入第三个变量。然后检查引入第三个变量后自变量与因变量原有关系的变化情况,由此澄清与深化对原有关系的认识,并揭示两变量的真实关系。这种引入第三变量对两变量关系进行检验,以解释或确定变量间关系的过程叫做分析的详析化,被引入有变量叫做检验因素或控制变量。
详析模式是由美国社会学家保尔·拉扎斯菲尔德(Paue? Lazarsfeld)及其助手,但其主要思想来源于塞谬·斯多弗(Sanull Stouffeb)在其名著《美国士兵》中所做的工作。《美国士兵》是斯多弗在第二次大战期间对美国士兵的士气所作曲调查研究成果。美国士兵的厌战情绪是众所周知的,那么产生这种情绪或者说影响军队士气的因素有哪些?他首先检验了一些公认的假设,例如:“教育水平越高的人越不愿当兵。”等。但出人意料地是,调查结果与这些公认的模式相反,如教育水平越低的人更不愿当兵。
原因是什么?斯多弗在参考群体和相对剥夺感的思想中找到找到了对这些结果的解答。简单地说,他认为士兵们评价自己的处境并不是用绝对的、客观的标准,而是用他与周围人的相互对比来评价的。当人们在与周围的人(即他的参考群体)相比发现自己“吃亏”了时。他就会有一种相对剥夺感,即他好像觉得自己被别人剥夺了什么。运用参考群体理论和相对剥夺感理论,对教育水平低的人更不愿应征的原因的解释是:教育水平低的人其朋友也多是教育水平低的人,在战时由于教育水平低的人从事国防工业或国防生产的人较多,所以免于入伍的人也较多,因此其中被征入伍者与其朋友相比就觉得格外吃亏。这些情况在教育水平高的人中间则不存在。
斯多弗的解释使调查结果得到合理的解释,但由于在研究设计时并未预料到这些情况,故无法以经验数据对上述解释进行印证,但他的逻辑解释为详析模式的建立铺平了道路。其要点在于通过其他变量(参考群体——朋友)来解释两变量(教育水平与应征意愿)间的关系。斯多弗的工作后来由拉扎斯菲尔德及其同事继续进行,他们用数据证实了斯多弗的解释,并发展出详析模式。下面我们用一个例子来说明如何运用详析模式,即如何使用检验因素对两变量间的关系进行检查。
例1? 表15—2中青年人与老年人收听宗教节目的比例相差9%(26%一17%),它表明年龄大的人较喜欢收听宗教节目。
表15—2? 年龄与收听宗教节目
听收宗教节目 |
青年人听收比例 |
老年人听收比例 |
收听
不收听 |
17%
83% |
26%
74% |
百分比总和 |
100% |
100% |
在迫问为什么会产生这种现象时,研究者假定这是受了教育的影响,即年龄大的人喜听宗教节目可能是因为他们的教育水平散低。为了检验这个假设,将调查对象按不同教育水平分组,制成表15—3。
表15—3 年龄与与收听宗教节目(控制教育)
收听宗教节目 |
高教育程度 |
低教育程度 |
青年人 |
老年人 |
青年人 |
老年人 |
收听
不收听 |
9%
91% |
11%
89% |
29%
71% |
32%
68% |
百分比总和 |
100% |
100% |
100% |
100% |
在表15—3的高教育组中,青、老年收听宗教节目的比例相差2%(11%-9%),在低教育组中相差3%(32%一29%),均较差异9%小了很多。这说明:当消除了教育这个因素的影响后,青年、老年收听宗教节目的比例差异很小。换句话说就是,年龄与收听宗教节目无关,两者原来所具有关系是由教育引起的,是因为两者同时分别与教育相关。这样一来,两变量间关系的真伪以及“为什么有这种关系”的问题获得了解答。老年人较喜欢听宗教节目是因为老年人文化水平较低,而低文化水平的人较喜欢收听宗
在这个例子中作为检验因素的变量是教育水平,检查的过程运用的是所谓的“分表法”。具体地说就是:
- 首先描述变量X和Y的关系(本例中的表15—2),这时的关系称为原关系。
- 依据理论或经验选择检验因素,(本例中的教育水平)。
3.将检验因素分成不同层次或不同类别(本例分为高、低两个教育组),然后在每一类别中做X与Y的分列联表(本例分表15—3包括高教育组与低教育组两个分列联表),分表中X与Y的关系称为部分关系。??
4.对各分表中X与Y的关系(即部分关系)进行考察,(1)若X与Y的原关系在各分表中均消失了(即各分表中X与Y均无关),证明原关系主要由检验因素引起;
(2)若X与Y间的原关系在各分表中仍然存在(即各分表中X与Y的关系与原表相近),说明X每Y的关系不受检验因素的影响;
(3)若X与Y的原关系在各分表中存在,但较原关系减弱,证明X与Y间的关系部分受到检验因素的影响;
(4)若X与Y的原关系在一些分表中存在或加强,而在另一些分表中消失或减弱,说明X与Y的原关系的存在是有条件的。
前三种情况称为一般关系,而最后一种情况称为条件关系。? .
三、详析模式的主要作用
详析模式的一个主要作用是使调查研究可分享实验设计的一些优点。除了数理逻辑的演绎外,实验是科学研究中最有力的证明模型。它的理论基础是所谓的“差异法”,即假如一个例子在调查的现象中出现,而另一个例子并未出现,而这两个例子除了一点外其余都相同,则使这两个例子不同的就是引起现象的原因。因此可选择两个相同的群体作比较,只给其中一个以某种刺激,再观察这两个群体是否不同。若有不同,则这个刺激就是原因,这就是“事后实验设计”的特征。在社会现象的研究中,由于各种原因往往无法实施直接的实验,而只能采用间接的方式,详析模式则近似事后实验设计。
如例1中,欲了解年龄是否是导致收听宗教节目兴趣差异的原因,按照实验法的原理,必须找到两个群体;除年龄外其他方面完全相同,然后比较他们收听兴趣有无差异。但对调查来说找到这样相同的两个群体晕不可能的,因此它通过变量控制将不相干的阻素加以控制,例如教育水平,以使两个群体间的差异缩小。如果将这些不相干的因素加以控制后,年龄不同的两个群体其收听兴趣仍有差异,则就有较大的把握说年龄是一个原因。无疑,所控制的项目越多,则两个群体除一个变量不同外,其余可能越接近相同。这样详析模式就使调查近似于事后实验设计,从而成为社会科学中最有力的证明模式之一。
详析模式可以充分利用统计调查资料,并能够将研究引向深入。它一方面能对变量间关系作出描述,另一方面,通过引入第三个变量,它还可以澄清事实真相。这些事实真相包括两变量间关系的真伪或这一关系存在的条件和存在的原因等。从而使变量间的关系更具体、更精确、更可靠.分析的目的在于解释,详析模式在解释上的贡献很大,它不仅能证实和帮助解释,也能排除错误的解释,并能获得新的解释,因此它是建立理论和开发资料的有力工具。??
详析模式为人们提供了最为清晰的社会分析逻辑,只有了解和掌握其中的思想,我们才能理解更为复杂的社会统计技巧。
第三节 案例分析与详析模式的应用
案例2:
1848—1945年的医学统计资料表明,在过去的一个世纪中,精神病患者的比例在为增加。解释:工业化与城市化导致人与人之间关系紧张生活与工作竞争与压力增大。
如果考虑年龄这个因素,将其作为检验因素加以控制,分别检验每一个年龄段的精神病比例,就会发现其实在过去的一个世纪中,这一比例并没有改变,如果控制年龄在50岁以的话。(老年性痴呆症)。
案例3:
社会阶级与对民权的态度相关,相关方向是工人阶级的民权分数高。有人将此解释为低阶层人员意识形态上较“进步”与“开放”。
表15—4? 社会阶级与民权态度
民权分数 |
中产阶级 |
工人阶级 |
高
低 |
37%
63% |
45%
55% |
百分比总和
人数 |
100%
(120) |
100%
(120) |
假定这个调查这个调查是在美国华盛顿所做,由于该地区黑人比例极高,因此选择种族作为检验变量,控制检验因素后结果如下:表15—5。
黑人组与白人组中的中产阶级民权分数均高于工人阶级。
表15—5? 社会阶级与民权态度(控制种族)
民权分数 |
黑人 |
白人 |
社会阶级 |
中产阶级 |
工人阶级 |
中产阶级 |
工人阶级 |
高
低 |
70%
30% |
50%
50% |
30%
70% |
20%
80% |
百分比总和
人数 |
100%
(20) |
100%
(100) |
100%
(100) |
100%
(20) |
检验因素含于自变量之内
社会研究常常有一些极为笼统的命题,它们比较空泛、涵盖能力极大,但却无助于对问题的了解。例如“社会地位低的人精神病患者比例高”确为事实。但我们需要知道的是,究竟社会地位低的人的哪种因素促使精神病发生,是贫穷,工作枯燥,受人歧视,还是生活习惯或低教育水平?在得知社会地位的哪些因素对精神病的产生影响最大之前,我们对问题的理解是相当有限的。为使变量间这种笼统的关系具体化,找出在一个较抽象的自变量中对因变量起主要作用的因素,往往使用引入检验因素的办法。能使两变量间关系具体化的变量称为内含变量,作为检验因素的就是自变量中被理论或经验推测为对因变量起车要作用的那个因
素。下面是杜尔凯姆应用引入内含变量作为检验因素进行自杀研究的一个例子。
?例4:在控制了年龄这个因素后,杜尔凯姆发现结婚者较未婚者自杀率低,并发现这种差异不是因结婚与未结婚者有什么不同而造成的,而是婚姻本身降低了自杀率。但到底是婚姻生活的哪一部分造成这种结果的呢,需作进一步界定,因为家庭生活包括了不同的因素,它包括(1)夫妻、(2)子女,即家庭包括了两种组合;夫妻与家庭本身。两组起源不同,性质亦不一样,所产生的结果也不同。那么,家庭环境对于自杀率的影.响是由于前者还是由于后者?杜尔凯姆假设为后者。分表统计后发现,1887—1891年间100万个没有子女的丈夫们有644个人自杀,而100万个同龄未婚男子约有975人自杀。644与975的比率为100:150,即无子女的已婚男子的生存系数为1.5,他们的自杀率只比同龄未婚男子少三分之一。但是如果他们有子女,则情形大不一样,100万个有子女的丈夫们每年只有336人自杀,这个数目与975的比是100:290,这就是说,如果他们有子女,则生存系数几乎增加一倍。
显然,并不是婚姻本身对自杀有影响,而是家庭概论中的子女因素而产生的一种社会整合使然。
例5:一个有关母亲工作经历与学生高中毕业后升学愿望的调查结果表明,母亲婚前有工作经历者,其子女比较倾向升大学。但进一步的分析指出这种现象只有在劳工阶级中成立,在中产阶级中并不成立。此一条件关系帮助我们描述两个阶级之间的差异。
在社会研究中,社会观念、社会规范、思想意识,价值观等等都是重要的研究内容。但在复杂的社会中,除社会的一般文化规范外,在不同地区、不同群体、不同社会组织中还存在亚文化,研究者常常要个逐研究这些亚文化并将其加以比较。当欲对由各个亚文化组成的一般文化作概推时,条件关系的分析可以使我们免于作出错误的概推。
例如研究大学生的政治参与意识时,是对各地区、各类学校的学生做调查从各个分表中可以发现一些条件关系,由这些条件关系就可以判断以往做出的有关全国大学生政治参与意识的结论是否可信。
此外,由于条件关系比原来的关系更具体、详细,因而它能更有益于科学的预测.如果知道某种关系在A情况下强而在B情况下弱,这种了解显然比只知道一般情况下的变量关系更为深入、更有利于预测。
第四节 详析的一般程序
在资料分析中,为获得对变量间关系的正确认识与解释,需对这一关系进行详析。如前所述,详析内容涉及到很多方面,如关系的类型、关系的真伪,关系存在的原因和条件等等。为此要引入各种类型的检验因素,进行多次的检验,以逐步澄清和确定这乙关系。因此详析的过程是一系列的步骤,如何设计和安排这些步骤就成为一个重要问题。下面简要概述详析的一般程序。
一、首先确定两变量间关系的类型
在进行详析工作之前首先要对两变量间原关系进行考察。若两个变量之间关系较显著,就要进一步分析他们之间是对称,还是相互关系或因果关系。如果是相互关系,则要进一步查清其相互影响,比较两者谁是更持久性的固定关系变量,以尽可能地决定影响的主要方向。如果是因果关系,,则要确定谁是自变量,谁是因变量 。
二、确定关系的真伪
这里要分两种情况考虑,一是两变量统计相关的情形,一是两变量统计无关或相关不显著的情形。在前一种情况下,应考虑这种关系是否有内在的或有意义的关系,是否是受到某个外加变量影响的结果。对那些无法证明它与自变量及因变量没有关系或者有理论或经验表明它可能与自变量及因变量均有关系的变量,要作为外加变量进行考察。在后一种情形下,则要看其关系是否被抑制变量所抑制,特别是在理论和实际观察都表明它们有可能有关系时。当两变量间的原关系的方向与经验和理论所提供的方向相反时,就要考虑是否是歪曲变量在起作用。例如人们从经验中感觉到女人对政治的关心程度较男人低。如果资料显示出女人对政治的关心程度超过男人,就要考虑为什么资料与经验相对立,是不是有什么因素,例如教育水平等扭曲了真实的关系。
三、将两变量间的关系具体化?
在确定了两变量间的原关系为真后,则可以检查内内含变量,以使这二关系更具体。例如我们发现父亲的社会地位与孩子的职业选择高度相关。社会地位是一个很大、很抽象的概念,它包括职业、收入、声望、权力、教育水平等方面内容。究竟是社会地位中的哪个因素影响了孩子的职业选择呢?假如我们认为是父亲的职业、教育程度对孩子的择业行为影响最大,就要分别将这两个变量作为内含变量进行检验。
四、寻找变量间的因果链条??
在上述分析做完后,就要进行中介变量的检验,目的是对这一关系作出说明。例如经检验证明少年犯罪与家庭破裂高度相关,那么就要弄清为什么破裂家庭容易导致未成年子女犯罪?考虑到破裂家庭的小孩一般与母亲一起生活,可以假设是因为缺乏父亲的缘故。然后对此假设进行检验,如果为真,就可以说破裂家庭的小孩容易犯罪是因为他们缺乏可以模仿的父亲的形象、或缺乏父亲的严厉管教,由此就容易导致少年犯罪。
五、检查是否存在条件关系
完成上面的分析后,可集中检查条件关系,许多有价值的资料都是由这一步骤获得的。如上节所述,条件关系的检验可以证实解释的真伪。或对解释进行修正使其精确化,或从几个解释中选择一个正确的解释;或者更进一步,通过整合的解释,将原有的解释提高到更抽象的层次,因而形成更广泛、更有综合性甚至发展出新的理论。通过条件关系的分析我们还可以对事物的发展趋势进行预测。例如假定将年龄作为检验因素。如果在低年龄组中不同社会地位的人生活方式的差异不大,而在高年龄组中不同社会地位的人生活方式差别很大,就可以看出社会地位耐生活方式的影响将越来越小。此外,条件关系的考察还可以指自使关系存在、加强或减弱的条件,从而使我们对社会现象的描述更真实准确。?
需要特别指出的是,在调查分析中两变量关系只是代表分析的开始,而非结束,上述的详析程序也不是分析的结束。实际上在详析的过程中每一步分析都会得到一些结果,而这些结果可能提出一些新的问题,需进行更进一步的分析,如此反复不已。例如发现在工厂工作的已婚妇女较未婚妇女缺勤率高,首先想到的是以婚姻状况;如婚后家庭负担增多来解释这一现象。解释可能是错误的,或许不是婚姻状况,而是年龄这个外加因素的影响,即妇女年龄越大,越无法承受工厂工作的压力。假如将年龄予以控制后原关系消失,即结婚与否与缺勤率高低不相关,就可以断言婚姻本身并不决定缺勤行为。到此分析并未结束,这一分析结果导出了新的问题。此时可以进一步问:为什么年龄大的妇女缺勤多?是因为体力差,还是由于她们的.经济收入比青年女工高?再控制经济收入这一变量,如果年龄与缺勤行为间的关系消失,则我们可以知道,影响出勤率的主要原因不是年龄因素或体力因素,而是经济因素。
这个简单的例子说明,分析是一个不断探寻的过程,每一步分析都可能产生一个新的问题,而需检验新的资料、进行新的分析,新的资料又产生其他问题,如此循环往复,就使得我们对于调查资料的利用更加充分,并进而导致对社会现象的认识不断深化。
最后还需要说明的是,随着社会研究中所应用的数理统计方法的发展,对多变量的数量关系分析可采用较高级的统计技术,甚至只需利用计算机即可完成。尽管这些技术可以取代详析过程中的定量分析(如“分表法”也可以用净相关分析代替),但是在详析模式中所体现的分析思想和推理方法却是无法由计算机代替的。因为在详析过程中是将统计分析与理论分析密切结合,研究煮不仅要运用缜密的逻辑推理,而且要运用理论的洞察力和想像力对调查资料中所反映的客观事实或现象间关系作出理论解释。因此在现代社会调查中,调查研究人员不仅要努力掌握先进的统计技术,而且更重要的是要掌握科学的思维方式和推理方法提高对社会现象的分析能力和洞察力。
向上>>
上一章 量表与测验法
下一章 观察法
|