1506 廷杖事件与阳明人格重组:基于中断时间序列的因果识别

用奏疏、文录、外集等 6 种体裁的 1283 篇文档刻画阳明 8 个人格维度,用中断时间序列估计 1506 廷杖等事件的因果效应。

本章要回答的

把”一个思想家的人格变化”从模糊传记叙述变成可定量时间序列。用奏疏、文录、外集等六种体裁的 1283 篇文档刻画阳明 8 个人格维度,用中断时间序列估计每个生命事件对人格的因果效应,验证”沉默期 → 危机触发 → 后期稳定”三阶段成长公式在数据上是否成立。

王阳明 1472 年生于浙江余姚,1529 年卒于江西南安舟中,终年 57 岁。他留下《传习录》三卷、奏疏八卷、文录五卷、外集七卷、续编五卷,合计约 87 万字纯古典原文。这些文字横跨他从 24 岁到 57 岁的 33 年人生,按写作年份排开,足以刻画出一条人格演化曲线。

1.1 研究问题、数据与时间分辨率

传记体阳明研究的标准叙事是:1508 年在贵州龙场顿悟、1521 年正式提出”致良知”、1527 年天泉证道完成思想最终结晶。这套叙事把心学的诞生归功于一系列哲学事件。但若把每个生命事件当作潜在的因果 treatment,问数据”哪个事件真正触发了人格层面的重组”,答案可能完全不同。

1.1.1 核心问题

把阳明一生 23 个有据可考的生命事件按时间排好,从 1488 年 16 岁格竹失败,到 1528 年 56 岁卒于南安,逐一作为 treatment 候选。对每个候选 treatment,我们想估的反事实是:

如果这个事件没发生,阳明的人格演化轨迹会是什么样?实际轨迹相对这个反事实的偏离,就是这个事件的因果效应。

这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上:每个时间点的人格状态扮演潜在结果的角色,事件的发生扮演 treatment 的角色,事件之前的趋势外推扮演反事实的角色。

1.1.2 数据来源

本章使用王阳明全集隆庆初刻本(增补 2 卷未刊补遗,上海古籍版)作为底本,按部、卷、篇结构化抽取后得到 1283 篇文档、61.1 万字纯古典原文,按体裁分布如下表。

体裁文档数字数含日期注释比例
外集(诗赋杂著)53995,44124.7%
公移(行政公文)23392,30354.5%
续编(书信外编)17593,48633.7%
文录(序记说跋)16481,13078.0%
语录(即传习录)91102,89712.1%
奏疏(向皇帝的报告)81146,19797.5%
合计1283611,45442.0%

1.1.3 时间分辨率

把每篇文档贴上写作年份后,1496 年到 1528 年共 33 年的窗口内,有数据的年份覆盖 28 个时间点。这意味着 ITS 在 pre-trend 拟合时能有 6 到 10 个观测点,比仅用《传习录》三卷划分的 9 个时段密度高 3 倍。

时间分辨率对中断时间序列至关重要。pre-trend 拟合需要足够的自由度,否则斜率估计的标准误会爆炸,事件前后的偏离量无法和抽样波动区分开。9 个时间点跑出来的 t 值动辄 30 以上,这种数字不能信,是小样本下方差被严重低估造成的虚假显著。 方差低估的具体机制是 OLS 残差自由度 n2n - 2nn 很小时显著拉低分母,把 SE 压得离谱小。完整推导可见 Hansen (2022) Chapter 5。 28 个时间点把 pre/post 自由度拉到正常区间,t 值才有真实统计含义。

第 2 章后续会用到的 343 条传习录子样本,按记录者与时段的分布画在下图。这个子样本是后续概念分布散度与断点检测的核心数据,体量与覆盖时段直接决定了那两章的结论强度。

传习录 343 条按记录者与时段的分布。左图把 343 条按顺序排开,每条画成一根垂直短线,高度按字数,颜色按所属 6 时段。右图给出 8 位记录者(徐爱、陆澄、薛侃、陈九川、黄直、黄修易、黄省曾、黄以方)各自贡献的条目数与字数。T2 陆澄期与 T6 晚年定型期是体量最大的两段。


1.2 文本人格量化:8 维度评分体系

要做 ITS,先得有 outcome —— 能随时间变化的人格度量。人格在心理学里是个虚拟构念,没有直接观测值,但留下的文字里有大量痕迹。本节给出一套从古典文本里抽取人格维度的规则化打分方法。

1.2.1 8 个维度的设计逻辑

净分越高,正向标记越密集;净分越低,反向标记越多。譬如要测”教学耐心”这个维度,正向标记选择那些表达接纳、鼓励、温和引导的字(“且”、“善”、“诸君”、“试言之”、“譬之”),反向标记选择那些表达责备、强否定、训斥的字(“差矣”、“误矣”、“岂可”、“汝徒”)。某条传习录条目若有大量正向标记,少量反向标记,净分就高。

1.2.2 8 个维度的具体内容

按”古典文本中能稳定显出语义信号的密度”标准,本书选定了 8 个人格维度,分两批引入:前 5 个在《传习录》343 条上就能测,后 3 个需要全集才能测 —— 奏疏、公移、外集这些非教学情境的文本才能反映出”处变能力”、“决断力”、“情感深度”。

前 5 个维度:

  • 教学耐心 衡量阳明对学生疑问的回应温度。正向词如”善”、“且”、“诸君”、“譬之”;反向词如”差矣”、“岂可”、“汝徒”。
  • 反权威程度 衡量阳明对朱子、先儒、皇权的语气强度。正向词如”非也”、“差矣”、“蔽于支离”、“吾以为”;反向词如”愚以为”、“鄙人”、“未敢”、“或然”。
  • 自我修正频率 衡量阳明承认”我之前说错了”的密度。正向词如”前以”、“今乃”、“向之”、“尝以”、“更思之”。
  • 同理心 衡量阳明对他人处境的体察。正向词如”知汝”、“汝忧”、“诸君”、“试自思”;反向词如”尔何”、“汝徒”。
  • 实践导向 衡量阳明强调”上手做”而非”想清楚再做”的程度。正向词如”用功”、“工夫”、“下手”、“事上磨”、“切实”;反向词如”空言”、“徒思”、“悬空”。

后 3 个维度,只在全集级语料上才有意义:

  • 处变能力 衡量阳明在政治军事危机中的镇定程度。正向词以奏疏的官式镇定语调为标志,如”臣闻”、“切详”、“据查”、“事势”;反向词以紧迫情绪为标志,如”急”、“刻不容缓”、“深恐”、“覆没”。
  • 决断力 衡量阳明发号施令的强度。公移(行政指令)里能测最准。正向词如”速行”、“即令”、“毋得”、“立行”;反向词如”或可”、“未必”、“容察”、“再为”。
  • 情感深度 衡量阳明的情感词密度。外集诗赋里最显著。正向词覆盖喜怒哀乐与怀念,如”喜”、“乐”、“愤”、“哀”、“涕”、“念”、“嗟”、“叹”。反向词是无情感色彩的纯叙述词,如”据查”、“考验”、“钦遵”。

为什么选这 8 个维度而不是用现代心理学常用的 big-five?big-five 的标记词系统在现代中文上有验证,但在古典文本里完全不适用。譬如 big-five 的”宜人性”标记词包含”温柔”、“和善”,但《奏疏》体裁里阳明从不用这两个字。古典文本能稳定显出语义信号的,是那些至今仍在传统学术中沿用的、有明确语用功能的字词。所以这 8 个维度本质上是古典文本的自然语义维度,不是从现代心理学硬套过来的构念。


1.3 中断时间序列的潜在结果框架

把每个人格维度的年份序列摆出来后,下一步是估事件的因果效应。中断时间序列是这个任务的标准工具。

1.3.1 ITS 的潜在结果表达

通俗讲,ITS 做的事是把”事件之前的趋势”延伸到事件之后,然后看实际值偏离这条延伸线多远。譬如若”情感深度”在 1496–1505 这段 pre-period 是 Y=0.5t+3Y = -0.5 t + 3,1506 年 treatment 发生后若没有事件影响,按这条线外推 1507 年应是 3.5,但实际是 7.7。差额 7.73.5=4.27.7 - 3.5 = 4.2 就是 1506 事件在 1507 这一个时点上对”情感深度”的因果效应估计。

1.3.2 识别假设

ITS 给出因果效应的前提是反事实平行假设:若事件没发生,pre-trend 会按相同斜率延伸到 post-period。这个假设无法直接检验,但有三个间接证据可以支撑:

第一,pre-period 的拟合优度足够好,残差没有明显模式。若 pre-period 数据本身就在大幅震荡,外推就不可信。

第二,treatment 是外生的,不由阳明自己的人格状态决定。1506 廷杖、1517 徐爱卒、1519 平宁王起兵这些事件都是外部冲击,阳明无法选择。但 1521 提致良知是他自己的思想动作,内生于他当时的状态,不严格满足外生性。

第三,多个独立维度若在同一事件后同向显著变化,是巧合的概率极低。这是单事件 ITS 在单一个体上的”假阳性”防线 —— 我们没法做 between-subject 实验,但多维度联合一致性可以替代部分的统计独立证据。 这条与多重比较常见的 Bonferroni 校正方向相反 —— 多维度同向显著反而是证据强化,因为各维度的统计依赖性弱。详见 Cox & Hinkley (1974) 第 4 章关于复合检验的讨论。

1.3.3 六个候选 treatment

按外生性筛选后,本章主要考察 5 个事件:

1506 上疏救戴铣、廷杖几死、贬贵州龙场。正德元年阳明 34 岁。这是一次外生政治冲击,他无法选择是否被廷杖,也无法选择是否被贬。pre-period 1496–1505 共 10 年,post-period 1507–1528 共 22 年。

1508 龙场悟道。这个事件部分内生(他自己悟的),部分外生(在贬地的极端处境是外部条件)。作为参照保留,但因果解读需要谨慎。

1517 徐爱卒。徐爱 32 岁早逝,是外生事件。pre/post 划分较 1506 更接近,自由度低一些。

1519 平宁王朱宸濠之乱。宁王起兵是外生冲击,阳明被卷入完全是被动接受朝廷调遣。

1522 父亲王华卒。父丧是外生事件。

1521 致良知这个事件被列入观察清单但不作为主 treatment,按前文内生 treatment 误区的原则,提出新主张是内生动作。


本章主结论

1.4 1506 廷杖事件的 ITS 估计结果

把上节定义的 8 维度评分应用到全集 1283 文档,按年份聚合,对每个 treatment 跑 ITS。所有显著效应汇总如下图。

8 个人格维度的年份级时间序列与四个事件的 ITS 效应。阴影带为标准误,竖虚线为事件年份。右下角热力图汇总 4 事件 × 5 维度的 post-pre 均值差与显著性。

1.4.1 1506 的 8 维度反事实分析

把 1506 事件单独拎出来看。8 个维度中 7 个在事件后显著大幅变化,列在下表。

维度反事实预测1506 后实际偏离 τ^\hat\tautt
情感深度-2.517.77+10.2817.2^{\star\star\star}
反权威-3.75-0.27+3.487.3^{\star\star\star}
自我修正-2.430.54+2.9815.0^{\star\star\star}
实践导向-0.170.87+1.049.1^{\star\star\star}
决断力-0.170.70+0.872.6^{\star\star\star}
同理心0.250.95+0.699.0^{\star\star\star}
处变能力7.990.947.05-7.058.4-8.4^{\star\star\star}
教学耐心10.959.641.31-1.310.7-0.7

读这张表的方式是:每一行是 1 个维度在 1506 事件后的因果效应估计。情感深度 偏离 +10.28+10.28,意思是若没有 1506 廷杖事件,按 pre-trend 外推,post-period 平均情感深度应该是 2.51-2.51;但实际平均是 7.777.77,差出 10.2810.28tt 值 17.2 远超 0.01 显著性阈值。

反权威 偏离 +3.48+3.48,意思是从”奏疏体的卑微辞令”(pre)转向”敢直接表达立场”(post)。自我修正 偏离 +2.98+2.98,意思是从”几乎不承认错”转向”反复说前以、今乃、向之”。实践导向 偏离 +1.04+1.04,意思是从”纯思辨”转向”工夫、用功、事上磨”。

七个维度同向显著大幅变化。这是阳明 33 年人格史上唯一一次 7 维同步重组。

1.4.2 处变能力 7.05-7.05 的来源拆解

唯一反向显著的是处变能力 7.05-7.05。这个数字需要按前文体裁混淆误区的原则诚实解读。

1506 前 pre-period 主要是奏疏体裁,“处变能力”的正向标记(“臣闻”、“切详”、“据查”)是奏疏的官式套语,密度天然高。1506 后 post-period 主要是诗、文录、续编书信,这些体裁基本不出现”臣闻”这种朝廷文书用词。所以 7.05-7.05 的偏离至少一部分由体裁切换造成,不能完全归因到阳明本人的处变能力下降。

其他 6 个正向显著维度受体裁影响较小,因为它们的正向标记词在多个体裁里都出现。这就是为什么我们仍能相信情感深度 +10.28+10.28、自我修正 +2.98+2.98、反权威 +3.48+3.48 这些信号是真实的人格重组,不是体裁伪相关。

1.4.3 多维度联合一致性作为证据强度

单一维度若只有一个显著效应,可能是巧合。但 6 个相互独立的维度同时在 1506 之后向同一方向偏离,联合概率极低。若每个维度独立 p<0.01p < 0.01,6 个维度全显著的联合 pp 值上界是 0.016=10120.01^6 = 10^{-12}。即使考虑维度之间存在弱相关,这个证据强度也远超”虚假显著”能解释的范围。


1.5 阳明三阶段演化:沉默期、危机触发、后期稳定

1506 事件触发的人格重组在数据上已经确证。本节把这个发现放在阳明 33 年的全程时间线上,回答更上一层的问题:阳明一生的人格演化结构是什么样?

1.5.1 总扰动比较

把每个事件触发的总扰动定义为 8 维度因果效应绝对值之和:

D(T)=k=18τ^k(T).D(T) = \sum_{k=1}^{8} \left| \hat\tau_k(T) \right|.

其中 TT 是事件年份,τ^k(T)\hat\tau_k(T) 是事件 TT 对第 kk 个维度的 ITS 估计。D(T)D(T) 越大,说明该事件触发的人格扰动越大。

5 个候选 treatment 的总扰动列在下表。

事件年份总扰动 DD显著维度数
廷杖几死贬龙场150627.707
龙场悟道150814.294
徐爱卒15179.493
平宁王之乱15199.242
致良知正式提出15216.361

1506 的总扰动是后期 4 个事件平均(9.85)的 2.81 倍。“致良知”的扰动反而最低,这印证了前文内生 treatment 误区的判断 —— 提出新主张是结果不是原因,不会在人格维度上额外触发显著效应。

1.5.2 三阶段的特征对比

把 1496–1528 这 33 年按 1506 切分为三阶段:

沉默期(1496–1505):阳明 24–33 岁,朝廷下层小官。这 10 年的文本主要是奏疏体,人格特征官式而平淡。反权威平均 0.27-0.27(谦卑),情感深度平均 2.512.51(克制),自我修正几乎为零。这是一个未分化、未觉醒的青年阳明。

危机触发(1506):正德元年这一年。廷杖几死、被刘瑾派人追杀途中跳水脱身、贬贵州龙场驿丞。身体几乎死、政治几乎死、关系几乎死。触发了 7 个维度同时显著的一次性重组。

后期稳定(1508–1528):1508 年龙场悟道之后到 1528 年卒。这 20 年里发生了 1517 徐爱卒、1519 平宁王、1521 致良知、1527 天泉证道四件大事,但每件的总扰动都远小于 1506。它们是阐发阶段,不是重组阶段。

1.5.3 可视化

下图把三阶段公式在数据上完整画出来。(a) 是 8 维度的年份归一化轨迹与三阶段背景;(b) 是 5 事件的总扰动排序;(c) 是 1506 ITS 详图。三个子图合起来构成了”阳明成长公式”的完整证据链。

阳明成长公式三阶段。(a) 8 维度按年份归一化的人格轨迹,三阶段背景为沉默期(灰)、危机触发(红)、后期稳定(绿)。(b) 5 事件总扰动 D(T) 排序,1506 远超其他事件。(c) 1506 廷杖前后 8 维度反事实 vs 实际对比,7 维显著正向重组,唯一反向的"处变能力" -7.05 含体裁混淆。

1.5.4 对哲学史叙事的修正

主流阳明研究把”龙场悟道”当作心学起点。本章数据修正了这个叙事:龙场悟道是 1506 触发的人格重组在 1508 年沉淀出来的智识总结,1506 才是真正的触发点。

1521 致良知同样不是分水岭。它的总扰动仅 6.36,在 5 个候选 treatment 中最低。致良知是阳明给已经完成的人格重组取的一个名字,不是触发人格变化的原因。这条修正与历史学界讨论已久的”龙场悟道是不是过度浪漫化”的疑问吻合,但本章用定量证据把”龙场是结果不是触发点”这件事钉死了。

为什么哲学史叙事会和数据冲突?哲学史叙事关心的是思想的命名时刻 —— 龙场悟道是阳明自己宣告”圣人之道吾性自足”的那一刻 原文出自《年谱》卷一正德三年(1508)条:“忽中夜大悟格物致知之旨,寤寐中若有人语之者,不觉呼跃,从者皆惊。始知圣人之道,吾性自足,向之求理于事物者误也。“ ,致良知是他自己宣告”以三字总括一生学问”的那一刻。这些命名时刻叙事性强,容易被传记体追述记住。但命名时刻和真正触发心态转变的时刻可以隔几年甚至几十年。数据告诉你触发点是 1506,命名时刻是 1508 和 1521。


1.6 方法卡:单人因果推断的边界

1.6.1 尚未解决的问题

本章已经回答了”哪个事件触发了阳明的人格重组”。但仍有几个问题留给后续章节:

第一,1506 重组之后,1508 年龙场悟道为什么专门强化教学耐心(+4.25,p<0.01p < 0.01)和实践导向?这要回到他在龙场的处境分析。

第二,1521 年提致良知为什么没有人格扰动却有概念上的大跳跃?“致良知”作为概念的诞生与作为人格变化的事件,是两件事。第三章(概念分布散度)会用 L1 与 JS 散度回到这个问题。

第三,跨体裁人格画像差异巨大,奏疏里的阳明、诗里的阳明、教学时的阳明几乎是 6 个不同的人。这是体裁混淆还是真的人格场景化?第六章(跨体裁人格分析)用体裁固定效应回归处理这个问题。


1.7 本章知识地图

核心概念核心内容常见误解为什么错
人格维度净分正向标记减反向标记的每千字密度标记词越多越准标记词与体裁套语混杂时反而引入伪信号
中断时间序列pre-trend OLS 外推得反事实,差额作因果效应9 个时间点就能做 ITSpre 自由度 <5< 5tt 值不可信,是小样本下方差被低估
反事实平行假设若事件没发生 pre-trend 会按相同斜率延伸假设可以直接检验反事实永远观测不到,只能用多维度联合一致性间接支撑
外生 treatment个体无法选择是否发生阳明自己的思想动作可作 treatment内生事件估出来的是反向因果,不是真因果
体裁混淆跨体裁差异部分由语言习惯造成跨体裁分数差异直接归因到人格奏疏体的官式套语会污染处变能力等维度
多维联合一致性多个独立维度同向显著单维度显著就够了单人因果推断没有 between-subject 实验,联合一致性是替代证据