可能是(或者被怀疑是)谎报了其真实的家族归属情况。我们使用这种武断的剔除方式,可能会低估真实的世族人数,从而使得结论成立的概率下降了。如果在这种情况下,我们的结论在统计上仍然成立,那么可以说明我们的结论是相当稳健的。总之,当我们做出了不利于我们结论的假设,并且使用多个度量方式,仍能得出一致结论,这无疑会大大增加我们结论的可信性。<注:"但是这种方法使得研究结论的精度会下降,比如解释变量对于被解释变量作用大小的具体数值就会受到影响。度量误差一般包括系统性与非系统性误差,不同的误差形式对因果推断的影响不同,更多讨论请见Kingetal.(1994,151)。">
2.样本选择问题
无论是定性还是定量方法都面临样本选择问题。尽管定量方法基于大样本统计,一定程度避免了极端案例或者特殊案例对于研究结论的影响,但是不恰当的样本选择仍将影响研究的可信性。因此,样本选择——尤其是如何处理幸存者偏差问题——是历史社会学研究中的一大挑战,这是由其经验材料的历史属性决定的。我们无法影响到材料的生成过程,甚至无法获知哪些因素影响到了材料的生成。对于这类问题,我们首先要对材料的可靠性保持警惕与怀疑,尤其需要注意该材料的生成过程与我们所关心的问题之间是否有内在关联;其次,在研究对象的选择上,要尽量避免基于幸存案例的比较,以及扩大样本选择范围,从而增加差异性;另外,好的研究设计也能够一定程度上避免样本选择偏误对因果估计的挑战。
样本选择的典型偏差是依据被解释变量选择样本。比如研究g,m时,如果我们选择所有出现g,m的国家作为分析样本,会导致所观察到的经验现象没有差异性(所有样本都发生了g,m)。因此在进行因果推断时,会出现相当大的挑战。正如上文所述,因果效应的估计依赖于对反事实案例的构造与比较,因为我们希望能够观察到所关心的经验现象在发生与不发生之间产生的差异。依据被解释变量选择样本,无疑会限制这样的比较。不过,历史社会学的方法论导向,尤其是对“求同法”与“求异法”的运用,使得学者对差异性事件非常敏感,因而这类选择偏差不容易出现(Moore1966;Skocpol1984,410)。
样本选择偏差的第二种类型是幸存者偏差问题(survivorshipbias)。如果某些经验观察对象的记录丢