Page 243 - 《社会》2014年第5期
P. 243
社会· 2014 · 5
为了让变量名有较好的提示作用,研究者在给变量命名时常常选
用多字母符号,例如用 犈犖犘 代表“ 犲犳犳犲犮狋犻狏犲狀狌犿犫犲狉狅犳 狆 犪狉狋犻犲狊 ”。但是,
这种标记方法是很不科学的,因为它在模型里意味着连乘,很容易让研
究者产生混淆。
社会科学研究者为了将定类变量纳入回归模型,常常将其转化为
虚拟变量处理。与此不同,在遇到这种情况时,物理学家会建立不同的
模型,而不是为了满足回归的要求对变量进行转换。在目前涉及虚拟
变量的社会科学研究中,有相当一部分都是成问题的。
三、从描述型模型到预测型模型
塔格培拉认为,要让社会科学真正实现科学化,社会科学家们必须
改变目前的建模思路,人们不应当把大量时间用于寻找最完美的事后
解释,而应当学会发挥想象力,在理论意义的基础上建构预测型模型。
他以自己所从事的一个政治学研究为例,说明了建构预测模型时
的几个重要概念和基本原则( 犜犪犪 犵 犲 狆 犲狉犪 , 2008 : 34-42 )。假定 犞 代表
在两次连续选举时更换了自己所选党派的选民比例, 犖 代表参加竞选
的党派数量,作者认为,后者对前者有影响,用数学方式表达出来,即
犱犞 / 犱犖> 0 。
在测量党派数量时,由于党派的大小有时差别很大,故可以做以下
,党派数就可
处理:假定第 犻 个党派在选举中所获得的选票比例为狏 犻
2
以用下面的式子表达: 犖=1 / Σ ( 狏 犻 )。这里可能有人提出各种质疑,比
如有的选民这一次参加投票而下一次却弃权。塔格培拉认为,这并不
成为上述模型不成立的理由,相反它是应当破除的思维定势,因为建模
的目的本来就是为了帮助人们进行简化,即使是物理学的公式也不可
能考虑到所有的情况,人们在建立模型时应该抓住所研究问题的逻辑
特征,大胆使用“奥康剃刀”,这样才有可能建立起与所研究问题相吻合
的逻辑模型。社会科学家在遇到这种问题时往往不敢进行简化,这是
阻碍他们发现普适模型的重要原因。
在建立起方向性模型 犱犞 / 犱犖> 0 之后,许多社会科学家便会收集
数据,建立一个线性回归,如 犞=犪+犫犖 ,随后看 犫 是否大于零,观察
一下该回归的显著性以及决定系数,此后便可以发表文章,结束研究。
塔格培拉问道,为什么社会科学家都不去关心 犪 和犫 的实际大小呢?
· 2 3 6 ·