首页 > 动态信息 > 新闻资讯
悦读 | 定量社会科学能为历史学带来什么——以中古士族为例
发布日期:2025-01-26

2023年,北京大学高等人文研究院举行 “学术前沿:人文与社会科学的范式突破与再理论化(2023)——‘未来记忆’国际青年学者讲座系列特别专场”。该活动由纽约州立大学陈丹丹教授策划召集,依托“全球研究论坛”开展。

“专场”笔谈中有五篇佳作刊载于2024年第6期《学术月刊》,其中,本篇《哲人入丛林:国际关系与政治哲学共同转型的可能》作者为纽约大学政治学系助理教授王海骁。








历史学者对量化分析多持抵触态度。这种抵触并非“过错”或“偏见”。恰恰因为历史学内部的“量化”研究质量不高,才导致这种对数据分析的反感成为学科的主流。本文用中古士族衰亡这个话题为例,以说明历史学的量化研究在数据分析方法上存在缺陷。这些缺陷也为有关中古史核心问题的探讨带来不必要的分歧。用来自社会科学的更成熟的数据分析方法,恰能辅助历史学走出分歧,开启新的研究思路。


一、士族的政治地位:毛汉光、谭凯等“量化”研究中的幸存者偏差


中古史长期以来对士族衰亡的理解存在分歧,简言之,陈寅恪、包弼德(Peter Bol)、吴宗国等“衰退派”认为,随着科举的发展,士族失去任官特权,且社会对于出身的认知也发生变化。[①]而以毛汉光、姜士彬(David Johnson)和谭凯(Nicolas Tackett)为代表的“猝亡派”通过收集数据,试图“量化”证明士族终唐一世保持强势,并未出现“地位下降”。[②]相较于逐渐衰退,他们认为士族“猝亡”于唐末农民起义等突发事件。这些数据分析看似自圆其说,却在中古史学界受到很多批评。[③]笔者在私下里与国内知名中古史学者们的交流中,也深感他们对此类研究的失望,以及由此而来对“量化”本身的不满。但猝亡派的“厨艺”缺陷不该影响“食材”本身的价值:数据无罪,只是需要正确的分析方法而已。
中古史的量化范式本是跨学科的舶来品,但长年以来与统计学以及定量社会科学的发展相脱节。虽然学者们的数据收集愈发翔实、系统,但分析方法却停留在20世纪70年代,也因此会犯下常识性的逻辑谬误,即“幸存者偏差”。具体而言, “猝亡派”(此处以谭凯为例)分析数据的方法无外乎统计高官中士族所占比例,并观察该比例在不同时期的变化。但这种过于关注已获得政治成功的官员(即官场晋升中的“幸存者”)的统计量,却混淆了条件概率。谭凯关注的高官中士族所占比例,是“一个高官有多大概率是士族”,即Pr(士族|高官)。但更能反映士族地位及社会流动的统计量则是“一个唐朝士族有多大概率能成为高官”,即Pr(高官|士族),以及该概率与非士族任高官概率[Pr(高官|非士族)]的差值,在不同时期的变化。猝亡派分析数据时混淆了Pr(高官|士族)和Pr(士族|高官)这两个条件概率。


(图源网络)

经“猝亡派”们的计算,以宰相为标准,Pr(士族|高官)自初唐至晚唐保持在70%左右。[④]这说明无论初唐、晚唐,士族相较于非士族群体都具备任官优势,毕竟士族是少数人,而其在高官中的占比却一直保持较高水平。但若以此认为“士族地位没有下降”,就落人混淆条件概率的“统计陷阱”中了。尽管近300年时间内,唐高官中士族占比保持相似的量级,但士族的人口基数却飞速繁衍。古代权贵群体的子嗣存活率远高于普通群体,而人口又是指数型增长的。即使每代的士族存嗣率仅高于非士族群体存嗣率25%,按照指数计算,从初唐到晚唐经过8-9代之后,士族群体对非士族群体的总人口比例也会增长至少5倍左右(虽然士族依然会是相对而言的少数人)。[⑤]但高官中的士族占比却终唐一世保持相似量级,远未匹配上述人口比例的飞速增长。换言之,在我们理解混淆条件概率的谬误后,再按照“猝亡派”自己的统计口径来看,会发现士族(之于普通群体)的相对优势反而是随时间下降的,并非他们所说的“保持强势”或“没有下降”。“猝亡派”用来说明士族保持强势的数据反而暗含着巨大的社会流动。[⑥]

总之,用高官来衡量士族升降,其关注点应为:Pr(士族|高官)- Pr(高官|非士族)的差值在不同时期的变化;若用官品来衡量,则为E(官品|士族)-E(官品|非士族)在不同时期的变化。“猝亡派”几十年来的研究都仅仅关注一个颠倒的条件概率以及条件期望值。围绕士族衰亡的辩论虽长期相持不下,却早已步入死胡同:一方对数据的分析存在根本谬误,但他们的批评者未能察觉要害,却转而质疑量化范式本身。
二、控制变量与多元统计的重要性


中古史学者对士族与科举的数据分析也从未考虑过控制变量,因此难以准确反映复杂的历史情境。有关社会流动和制度变迁的问题涉及多个因素的相互作用,若用数据分析来研究,需采用“控制变量”的统计学方法以排除其他因素干扰。以户籍为例,该制度被认为限制了阶层流动,但直至20世纪初,社会和学界总有声音称,“一个人是城市还是农村户口并不重要,他究竟生活在城市还是农村才重要。农村长大的孩子后期职业发展不如城市人,其原因并非农村户口对他发展的限制,而是因为农村的成长环境影响了他的知识、世界观、职业观等”。那么,一个同时在农村长大又拥有农村户口的人,农村户口对他的职业发展到底有多大影响?还是说这种相关性实际上仅仅反映了“在农村长大”的影响而已?社会学家通过多变量统计模型,将“在农村长大”与“农村户口”同时作为变量估算,从而剔除了“在农村长大”这一控制变量对农村户口效应的干扰。他们发现,即便控制住“在农村长大”变量的影响,农村户口的负面效应依然显著,因此严谨地驳斥了上述论调。[⑦]同理,尽管“猝亡派”认为士族更容易考科举,但单纯依靠史料罗列和简单统计及第者中的士族占比并不足以否定科举对社会流动的价值。应当采用控制变量分析。我们探究科举之于阶层流动的意义需要回答如下问题:一个既有科举功名又出身士族的人,在获得高官时,其成就到底更多来自士族还是科举?一个既无科举功名又无士族身份的人,在事业受限时,其瓶颈究竟更多来自家世寒微还是科举不利?简言之,多变量统计模型可以帮我们通过控制变量的方法,估算出剔除士族影响后的科举“净效应”。


(图源网络)

现有量化研究的另一缺陷是其在衡量士族优势时所采取的士族定义与中古史学界的整体认知不符。中古研究的一大共识是士族概念具备双重维度:(1)基于较远祖先成就的“门第”“门资”。(2)基于父亲、祖父等近祖的权力与社会网络。多年来不同学者描述此二维度时用词或不同,但大意却一致。例如,唐长孺曾就南朝“门资”(维度1)与魏晋时期的“势族”之“势”(维度2)撰写过经典论述;而陈爽则将此二维度概括为“重汉魏传统”(维度1)与“重当时冠冕”(维度2)。[⑧]从刘宋王僧虔与檀珪的书信到北齐的羊毕之争,从唐高宗的禁婚再到郑覃的拒婚,体现此二维度内在张力的史料更是浩如烟海,为我们耳熟能详。此二维度的消长直指中古中国在“贵族性”与“官僚化”双重性格间的反复。官僚化虽是历史的最终走向,但贵族性的消散究竟在何时,是渐变还是剧变,都是十分有意义的宏观历史话题,也需要实证研究来定“量”。士族衰亡的有关辩论聚焦士族任官优势在唐代的变化,那么估算门第与近祖分别对任官优势的影响则为回应更宏观的历史关怀提供了非凡机会。遗憾的是,现有量化研究虽然对士族定义有所不同,却都采取了单维度的操作方式,甚至出现了像毛汉光那样把“汉魏旧门”的崔浩、卢柔和北镇武勋如斛律光、尔朱光彦等混为一谈并称“

士族”的情况。基于这类缺陷的“统计”分析也为量化范式招致非议。[⑨]而在众多其他学科早已成熟的多变量统计方法可以实现同时分析两个维度对于个体事业的作用。
三、更恰当的方法:相似数据,相反结论


我最近在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)发表的合作研究,以谭凯的墓志数据库为分析基础。但我们的多元模型方法修正上述谬误,并采用控制变量多维检验的手段,估算门第、父祖、科举等因素对唐代精英仕途的影响,以官品为因变量。[⑩]我们用相似数据得到了相反结论。
在唐初,门第对官品有显著的正面影响,即大约两个正品的优势。然而,该效应很快下降,在唐高宗和武则天时期逐渐消失。而近祖效应,即父亲的官品对子女官品的正作用,在唐代则保持稳定:父亲每升一个正品(例如,由正八品下到正七品下),自己可获得略小于四分之一品(例如,由从九品下至从九品上)的提升。因为数据里墓主的终官官品均值在正七品下左右,这个效应并不小。通过在定量社科中早已成熟的多变量统计模型方法,我们终于能够区分门第与近祖的各自效应及其消长。作为中古特征的门第在唐初之后就不再影响个体在官僚化政权中的地位,而唐代却在另一维度与古今中外别无二致:都是“拼爹”的时代。此外,科举制度的影响从高武和玄宗时期开始变得显著,且随着时间的推移而增强,在晚唐达到了与唐初门第影响相似的水平。

(图源网络)

可见用正确的方法分析相似数据,完全可以得到(与猝亡派)截然相反的结论。而这些结论与其他中古史研究的发现互为表里。唐史学者们近年来重新厘清了“孤寒”“子弟”等词在中晚唐语境下的真实意义:这些曾被认为反映门第差异的词汇其实仅是对当朝家族政治地位的衡量。从本文的定量分析似可看出,这种观念转变有可能源于门第任官优势在高武之后便消失之事实。中晚唐的士人们在讨论出身时早已不认为南北朝意义的门第还有多少价值。数据明确显示唐帝国进人科举时代,而这场制度与阶层的转型也催生文化变迁。包弼德和麦大维(David Mullen)敏锐地观察到了与科举息息相关的思想转型及新政治身份的崛起,而陆扬更是提出了“清流文化”的概念。[11]陆氏在列举清流士人时,也注意到很多南北朝著姓,甚至是陈寅恪意义上的礼法旧贵族之成员。这些精英在“旧门阀价值观”没落后便参与到新价值系统与游戏规则的建构中来。若结合

本文的定量结果,从策略的角度看,旧族们之所以积极构建新价值,是因为门第的政治光环早已荡然无存。
士族研究近年来由中古史的“显学”走向冷却。但这个“传统话题”远非题无剩意,毕竟学界连士族衰亡这种基本问题都尚未形成共识。另一方面,对宏观历史脉络的再思考,尤其是重新重视大族群体的一般性、普遍性,也被认为是突破瓶颈的新思路。[12]对“量”的估测是把握群体之整体趋势的有效途径,因此量化依然有助于历史研究。只是毛汉光、谭凯等过往量化作品的不足使得量化范式的有益之处未能在中古史得到广泛认识。定量社科采用的成熟统计学方法,能够更严谨、系统地判断事物发展的整体趋势,从而帮我们走出分歧,进一步深化理解士族衰亡这一串联中古政治、社会、制度变迁的关键。
注释:
①陈寅恪:《唐代政治史述论稿》上篇《统治阶级之氏族及其升降》,北京:商务印书馆,2011年,第183-232页;吴宗国:《唐代科举制度研究》,沈阳:辽宁大学出版社,1992年,第284页-288页;包弼德:《斯文:唐宋思想的转型》,刘宁译,南京:江苏人民出版社,2000年,第182-153页。
②毛汉光:《中国中古社会史论》,上海:上海书店出版社,2002年;姜士彬:《中古中国的寡头政治》,范兆飞、秦伊译,上海:中西书局,2016年,第160-198页;谭凯:《中古中国门阀大族的消亡》,胡耀飞、谢宇荣译,北京:社会科学文献出版社,2014年。
③韩昇:《中古社会史研究的数理统计与士族问题——评毛汉光先生<中国中古社会史论>》,《复旦大学学报(社会科学版)》2003年第5期。
④Tackett, Nicolas, “The Evolution of the Tang Political Elite and its Marriage Network,” Journal of Chinese History[中国历史学刊(台湾)],4(2), 2020, pp. 277-304.
⑤古人大概每25-30年为一代,假设从初唐自晚唐黄巢起义誠,共有8代人,那么士族若每代比普通群体多存活25%的子嗣,8代之后,其人口与普通人口的比率,就会增长1.25⁸-1=4.96倍。如果多存活的子嗣更多,例如多存活1倍,那么这个比率就会增长2⁸-1=255倍。多代后的人口占比增长如此之大,是因为人口是次方级增长的(例:若每代存活2个男丁,3代后,就是2的3次方=8个)。我们从各种材料中看到的士族谱系,即便排除嫁接情况,也多是初世高官自下多代形成巨大“家族树”状,说明子孙的增量繁衍。
⑥若官僚员额本身扩张,会减缓士族相对境遇的下降,但谭凯等学者的统计口径是宰相,而宰相数量自唐初至晚唐恰恰没有扩张,若包括武则天时期的宰相人数激增,那么7-9世纪的趋势反而是宰相数量缩水。这意味着士族的相对境遇下降比正文中的推算还要快。
⑦Xiaogang Wu & Treiman, Donald, “Inequality and Equality under Chinese Socialism: The Hukou and International Occupational Mobility,” American Journal of Sociology, vol. 113, no. 2, 2007, pp. 415-445.
⑧唐长孺:《士族的形成和升降》,收入唐长孺:《魏晋南北朝史论拾遗》,北京:中华书局,1983年,第53-63页;陈爽:《世家大族与北朝政治》,北京:中国社会科学出版社,1998年,第157页。
⑨韩昇:《中古社会史研究的数理统计与士族问题——评毛汉光先生<中国中古社会史论>》,《复旦大学学报(社会科学版)》2003年第5期。
⑩Wen, Fangqi, Erik H. Wang, and Michael Hout, “Social mobility in the Tang Dynasty as the Imperial Examination rose and aristocratic family pedigree declined, 618-907 CE, Proceedings of the National Academy of Sciences, vol. 121, no. 4, 2024, e2305564121. 门第、近组以及科举为彼此的控制变量,且模型还包括有关地域集团和时间固定效应等控制变量。
11包弼德:《斯文:唐宋思想的转型》,刘宁译,南京:江苏人民出版社,2000年,第182-153页;麦大维:《唐代中国的国家与学者》,张达志、蔡明琼译,北京:中国社会科学出版社,2019年,第157-181页;陆扬:《清流文化与唐帝国》,北京:北京大学出版社,2016年,第165-304页。
12范兆飞:《超越个案:士族研究的问题与路径》,《中国史学研究动态》2017年第1期;仇鹿鸣:《失焦:历史分期论争与中文世界的士族研究》,《文史哲》2018年第6期。



分享:

Copyright@2014北京大学高等人文研究院    京ICP备案1253235    地址:北京市海淀区颐和园路五号北京大学李兆基人文学苑4号楼    技术支持:iWing