数据帝|神秘的力量:朝代更替与姓名长度
在量化历史研究中,我们会用到许多原本看起来与历史文本无关的变量,比如小冰期的开始和结束影响朝代变更、玉米和红薯的种植带来的人口变化、劳动力的稀缺与工业革命等。在一个偶然的机会下,我发现,名长度其实也是一个可以用在量化历史研究中的有趣变量。
首先来看一下历朝历代正史中的姓名情况。
上表来自张书岩的《单双名问题考察》,他将二十五史中出现的所有姓名进行了分类。首先可以看到,中国的单名率最高的时期出现在东汉、三国与两晋时期,几乎所有该时期的人物都是单名。在两晋之后,双名率突然上升。单名比例在而后的一千多年中围绕着50%进行波动,而在清朝时下降到了25%。东汉时的单名率突然上升,以及两晋后单名率的再次下降,历史学界对此有这样的解释:
汉晋时期,单名所以流行,一是因为在严格的避讳礼制的约束下, 二名「因其难讳」之故也;二是由于汉末王莽曾有「令中国不得有二名」之制以及附会古礼「讥二名,二名非礼也」的说法,通过「复二名」表示对其政敌惩罚的举措,在社会上产生了一定的影响。故有「后汉无复名者」之说。
然魏晋南北朝大动荡时期,传统的礼制遭到了空前的破坏,「宪章礼乐,寂灭无闻。」政权更迭,讳礼难从。尤其是少数民族纷纷入主中原,对中原传统的文化制度和习俗产生了很大的影响。在命名方面,他们仍保留本民族的名字而不用单名,或是虽采用汉姓而仍用本民族的复名,由此,造成了这一时期复名逐渐增多。正如沈德符所言:单名「至魏晋后,渐不复然。至五胡盗中原,胡名遂用三四字者」。
上文摘自闫廷亮的《唐人姓名研究》。在隋唐之后,由于修谱风气的兴起、人口膨胀导致重名增多、对审美的要求等原因,双名比例稳定在了一个比较高的水平,东汉、三国与两晋时期史书中几乎没有双名的现象再也没有出现。
但是,姓名长度的变动并不仅仅出现在王莽篡汉到南北朝的几百年中,中国的单双名比例,一直在被一种神秘的力量驱动变化。使用《中国历代人物传记资料库》数据,我们可以对中国的单双名变化进行一些简单的分析。
《中国历代人物传记资料库》数据包括中国历朝历代36万个历史人物的资料,如姓名、出生年月、出生地点等。该数据库现主要包括唐朝至清朝的历代人物索引、生卒年表、墓志铭、正史与方志列传等。根据该数据,我们首先可以画出每个年份出生人物的平均姓名长度:
一张奇怪的散点图出现在眼前。平均名长度在唐初显著上升,第一次转折发生在公元690年,随后平均名长度一直下降至公元792年,之后再次掉头上升,并在此后的数百年中没有发生显著的变化趋势。公元1200年,平均名长度再次急速上升。到公元1340年,区区140年中,单名人数由原本的50%下降至不到20%。
接下来,中国的平均名长度经历了整个历史上最诡异的变化——先是像乘坐过山车那样直冲而下,平均名长度至1500年下降到了1.2以下,这意味着单名人数在这160年内从20%以下上升至80%以上。这还没完,又140年过去,单名人数乘坐同一辆过山车逆流而上,1640年左右,中国的单名人数比例再次下降至10%左右。下表左边2列和右边2列分别表示1502年与1610年进士一甲与二甲前四十名,其单名和双名的对比,一目了然——前者有9个双名,占22.5%,而后者却有33个双名,占82.5%。
紧随这次剧烈波动的是一次较小的波动。平均名长度从公元1640年的1.9下降到公元1730年的1.7,又重新上升,在公元1910年回到了1.9左右。上图告诉我们的信息是,名长度不仅在朝代间具有很大差异,在一个朝代内部仍然存在剧烈波动。这些波动可能来自几个方面。
一,人名的来源资料不同造成的波动
魏斌在《单名与双名:汉晋南方人名的变迁及其意义》中写道,即便是史书中单名大行其道的东汉和三国时期,底层居民仍然存在大量双名。在王莽颁发“去二名”诏书70多年后,章帝建初二年的《汉侍廷里父老僤约束石券》中共出现24个人名,分属于6个姓,单名、双名者各有12人。
因此,是否有可能是姓名的来源文献的变更造成了名长度变化?例如某些年份的姓名来自上层人士,而另一些年份全部来自底层人士呢?
检查名长度变化的波谷与波峰——公元1500年和公元1640年——的所有姓名来源后可以发现,这两个年度的姓名都有90%以上来自当年的进士登科录、进士同年总录以及科序齿录,是一个人群的稳定样本。因此,来源资料的变动不太会是原因。
二,人名来源籍贯不同造成的波动
第二种造成名长度变化的可能是个人的出生地不同。就公元1500年和公元1640年的姓名来源来说,即便都是进士,他们也可能存在时而集中于南方、时而集中于北方的可能。而一般来说东南地区的名长度要高于北方地区。为了检查这种现象,我们首先搜集了从公元1500年到公元1640年每一个人名的籍贯,并计算其经纬度,最后将公元1500年至公元1640年的人口每隔十年计算一个"当年平均经纬度",来反映当年进士的来源地的大致情况。
可以看到,从1500年至1640年,数据中姓名来源地的平均经纬度其实并没有发生什么变化。在1600年以前,姓名来源地的平均经纬度全部集中在武汉周边的一小块区域中,而这一百年间的平均名长度却发生了巨大的变化。因此,来源地的移动,也不太会是原因。如果这些姓名的来源地和社会阶层都没有发生大的变化,那么平均名长度出现大幅度波动的原因会是什么呢?不妨将平均名长度首先移动平均平滑,再按照朝代分开,可得下图:
从上图可以发现一个现象——除了持续时间仅有100年的元朝以外,其他四个王朝结束时,其平均名长度总是处在上升阶段的。尤为有趣的是明清两朝,它们都出现了一个共同的特征——平均名长度在王朝初期出现大幅度下降,随后触底,再反弹。而当平均名长度反弹至王朝开始时的高度时,这个王朝就结束了。
接下来,使用2005年1%人口抽样调查数据,我们可以计算出本世纪上半叶以来各年度出生人口的名长度,如下图所示:
无论是人口、政策还是审美等之前文献考虑的因素,都不能很好地解释王朝更替时平均名长度先降后升的异常波动。有什么因素会在王朝开始和结束时保持一致,唯有在王朝中前期时处于低位呢?似乎可以说,影响平均名长度的,还应当有一项神秘的因素。这项因素可能在影响平均名长度的同时还对国家的命运有着重要的意义,但我们还没有理解。