本章目录
本章目录
把”一个思想家的人格变化”从模糊传记叙述变成可定量时间序列。用奏疏、文录、外集等六种体裁的 1283 篇文档刻画阳明 8 个人格维度,用中断时间序列估计每个生命事件对人格的因果效应,验证”沉默期 → 危机触发 → 后期稳定”三阶段成长公式在数据上是否成立。
王阳明 1472 年生于浙江余姚,1529 年卒于江西南安舟中,终年 57 岁。他留下《传习录》三卷、奏疏八卷、文录五卷、外集七卷、续编五卷,合计约 87 万字纯古典原文。这些文字横跨他从 24 岁到 57 岁的 33 年人生,按写作年份排开,足以刻画出一条人格演化曲线。
1.1 研究问题、数据与时间分辨率
传记体阳明研究的标准叙事是:1508 年在贵州龙场顿悟、1521 年正式提出”致良知”、1527 年天泉证道完成思想最终结晶。这套叙事把心学的诞生归功于一系列哲学事件。但若把每个生命事件当作潜在的因果 treatment,问数据”哪个事件真正触发了人格层面的重组”,答案可能完全不同。
1.1.1 核心问题
把阳明一生 23 个有据可考的生命事件按时间排好,从 1488 年 16 岁格竹失败,到 1528 年 56 岁卒于南安,逐一作为 treatment 候选。对每个候选 treatment,我们想估的反事实是:
如果这个事件没发生,阳明的人格演化轨迹会是什么样?实际轨迹相对这个反事实的偏离,就是这个事件的因果效应。
这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上:每个时间点的人格状态扮演潜在结果的角色,事件的发生扮演 treatment 的角色,事件之前的趋势外推扮演反事实的角色。
1.1.2 数据来源
本章使用王阳明全集隆庆初刻本(增补 2 卷未刊补遗,上海古籍版)作为底本,按部、卷、篇结构化抽取后得到 1283 篇文档、61.1 万字纯古典原文,按体裁分布如下表。
| 体裁 | 文档数 | 字数 | 含日期注释比例 |
|---|---|---|---|
| 外集(诗赋杂著) | 539 | 95,441 | 24.7% |
| 公移(行政公文) | 233 | 92,303 | 54.5% |
| 续编(书信外编) | 175 | 93,486 | 33.7% |
| 文录(序记说跋) | 164 | 81,130 | 78.0% |
| 语录(即传习录) | 91 | 102,897 | 12.1% |
| 奏疏(向皇帝的报告) | 81 | 146,197 | 97.5% |
| 合计 | 1283 | 611,454 | 42.0% |
1.1.3 时间分辨率
把每篇文档贴上写作年份后,1496 年到 1528 年共 33 年的窗口内,有数据的年份覆盖 28 个时间点。这意味着 ITS 在 pre-trend 拟合时能有 6 到 10 个观测点,比仅用《传习录》三卷划分的 9 个时段密度高 3 倍。
时间分辨率对中断时间序列至关重要。pre-trend 拟合需要足够的自由度,否则斜率估计的标准误会爆炸,事件前后的偏离量无法和抽样波动区分开。9 个时间点跑出来的 t 值动辄 30 以上,这种数字不能信,是小样本下方差被严重低估造成的虚假显著。 方差低估的具体机制是 OLS 残差自由度 在 很小时显著拉低分母,把 SE 压得离谱小。完整推导可见 Hansen (2022) Chapter 5。 28 个时间点把 pre/post 自由度拉到正常区间,t 值才有真实统计含义。
第 2 章后续会用到的 343 条传习录子样本,按记录者与时段的分布画在下图。这个子样本是后续概念分布散度与断点检测的核心数据,体量与覆盖时段直接决定了那两章的结论强度。
1.2 文本人格量化:8 维度评分体系
要做 ITS,先得有 outcome —— 能随时间变化的人格度量。人格在心理学里是个虚拟构念,没有直接观测值,但留下的文字里有大量痕迹。本节给出一套从古典文本里抽取人格维度的规则化打分方法。
1.2.1 8 个维度的设计逻辑
净分越高,正向标记越密集;净分越低,反向标记越多。譬如要测”教学耐心”这个维度,正向标记选择那些表达接纳、鼓励、温和引导的字(“且”、“善”、“诸君”、“试言之”、“譬之”),反向标记选择那些表达责备、强否定、训斥的字(“差矣”、“误矣”、“岂可”、“汝徒”)。某条传习录条目若有大量正向标记,少量反向标记,净分就高。
1.2.2 8 个维度的具体内容
按”古典文本中能稳定显出语义信号的密度”标准,本书选定了 8 个人格维度,分两批引入:前 5 个在《传习录》343 条上就能测,后 3 个需要全集才能测 —— 奏疏、公移、外集这些非教学情境的文本才能反映出”处变能力”、“决断力”、“情感深度”。
前 5 个维度:
- 教学耐心 衡量阳明对学生疑问的回应温度。正向词如”善”、“且”、“诸君”、“譬之”;反向词如”差矣”、“岂可”、“汝徒”。
- 反权威程度 衡量阳明对朱子、先儒、皇权的语气强度。正向词如”非也”、“差矣”、“蔽于支离”、“吾以为”;反向词如”愚以为”、“鄙人”、“未敢”、“或然”。
- 自我修正频率 衡量阳明承认”我之前说错了”的密度。正向词如”前以”、“今乃”、“向之”、“尝以”、“更思之”。
- 同理心 衡量阳明对他人处境的体察。正向词如”知汝”、“汝忧”、“诸君”、“试自思”;反向词如”尔何”、“汝徒”。
- 实践导向 衡量阳明强调”上手做”而非”想清楚再做”的程度。正向词如”用功”、“工夫”、“下手”、“事上磨”、“切实”;反向词如”空言”、“徒思”、“悬空”。
后 3 个维度,只在全集级语料上才有意义:
- 处变能力 衡量阳明在政治军事危机中的镇定程度。正向词以奏疏的官式镇定语调为标志,如”臣闻”、“切详”、“据查”、“事势”;反向词以紧迫情绪为标志,如”急”、“刻不容缓”、“深恐”、“覆没”。
- 决断力 衡量阳明发号施令的强度。公移(行政指令)里能测最准。正向词如”速行”、“即令”、“毋得”、“立行”;反向词如”或可”、“未必”、“容察”、“再为”。
- 情感深度 衡量阳明的情感词密度。外集诗赋里最显著。正向词覆盖喜怒哀乐与怀念,如”喜”、“乐”、“愤”、“哀”、“涕”、“念”、“嗟”、“叹”。反向词是无情感色彩的纯叙述词,如”据查”、“考验”、“钦遵”。
为什么选这 8 个维度而不是用现代心理学常用的 big-five?big-five 的标记词系统在现代中文上有验证,但在古典文本里完全不适用。譬如 big-five 的”宜人性”标记词包含”温柔”、“和善”,但《奏疏》体裁里阳明从不用这两个字。古典文本能稳定显出语义信号的,是那些至今仍在传统学术中沿用的、有明确语用功能的字词。所以这 8 个维度本质上是古典文本的自然语义维度,不是从现代心理学硬套过来的构念。
1.3 中断时间序列的潜在结果框架
把每个人格维度的年份序列摆出来后,下一步是估事件的因果效应。中断时间序列是这个任务的标准工具。
1.3.1 ITS 的潜在结果表达
通俗讲,ITS 做的事是把”事件之前的趋势”延伸到事件之后,然后看实际值偏离这条延伸线多远。譬如若”情感深度”在 1496–1505 这段 pre-period 是 ,1506 年 treatment 发生后若没有事件影响,按这条线外推 1507 年应是 3.5,但实际是 7.7。差额 就是 1506 事件在 1507 这一个时点上对”情感深度”的因果效应估计。
1.3.2 识别假设
ITS 给出因果效应的前提是反事实平行假设:若事件没发生,pre-trend 会按相同斜率延伸到 post-period。这个假设无法直接检验,但有三个间接证据可以支撑:
第一,pre-period 的拟合优度足够好,残差没有明显模式。若 pre-period 数据本身就在大幅震荡,外推就不可信。
第二,treatment 是外生的,不由阳明自己的人格状态决定。1506 廷杖、1517 徐爱卒、1519 平宁王起兵这些事件都是外部冲击,阳明无法选择。但 1521 提致良知是他自己的思想动作,内生于他当时的状态,不严格满足外生性。
第三,多个独立维度若在同一事件后同向显著变化,是巧合的概率极低。这是单事件 ITS 在单一个体上的”假阳性”防线 —— 我们没法做 between-subject 实验,但多维度联合一致性可以替代部分的统计独立证据。 这条与多重比较常见的 Bonferroni 校正方向相反 —— 多维度同向显著反而是证据强化,因为各维度的统计依赖性弱。详见 Cox & Hinkley (1974) 第 4 章关于复合检验的讨论。
1.3.3 六个候选 treatment
按外生性筛选后,本章主要考察 5 个事件:
1506 上疏救戴铣、廷杖几死、贬贵州龙场。正德元年阳明 34 岁。这是一次外生政治冲击,他无法选择是否被廷杖,也无法选择是否被贬。pre-period 1496–1505 共 10 年,post-period 1507–1528 共 22 年。
1508 龙场悟道。这个事件部分内生(他自己悟的),部分外生(在贬地的极端处境是外部条件)。作为参照保留,但因果解读需要谨慎。
1517 徐爱卒。徐爱 32 岁早逝,是外生事件。pre/post 划分较 1506 更接近,自由度低一些。
1519 平宁王朱宸濠之乱。宁王起兵是外生冲击,阳明被卷入完全是被动接受朝廷调遣。
1522 父亲王华卒。父丧是外生事件。
1521 致良知这个事件被列入观察清单但不作为主 treatment,按前文内生 treatment 误区的原则,提出新主张是内生动作。
本章主结论
1.4 1506 廷杖事件的 ITS 估计结果
把上节定义的 8 维度评分应用到全集 1283 文档,按年份聚合,对每个 treatment 跑 ITS。所有显著效应汇总如下图。
1.4.1 1506 的 8 维度反事实分析
把 1506 事件单独拎出来看。8 个维度中 7 个在事件后显著大幅变化,列在下表。
| 维度 | 反事实预测 | 1506 后实际 | 偏离 | 值 |
|---|---|---|---|---|
| 情感深度 | -2.51 | 7.77 | +10.28 | 17.2 |
| 反权威 | -3.75 | -0.27 | +3.48 | 7.3 |
| 自我修正 | -2.43 | 0.54 | +2.98 | 15.0 |
| 实践导向 | -0.17 | 0.87 | +1.04 | 9.1 |
| 决断力 | -0.17 | 0.70 | +0.87 | 2.6 |
| 同理心 | 0.25 | 0.95 | +0.69 | 9.0 |
| 处变能力 | 7.99 | 0.94 | ||
| 教学耐心 | 10.95 | 9.64 |
读这张表的方式是:每一行是 1 个维度在 1506 事件后的因果效应估计。情感深度 偏离 ,意思是若没有 1506 廷杖事件,按 pre-trend 外推,post-period 平均情感深度应该是 ;但实际平均是 ,差出 。 值 17.2 远超 0.01 显著性阈值。
反权威 偏离 ,意思是从”奏疏体的卑微辞令”(pre)转向”敢直接表达立场”(post)。自我修正 偏离 ,意思是从”几乎不承认错”转向”反复说前以、今乃、向之”。实践导向 偏离 ,意思是从”纯思辨”转向”工夫、用功、事上磨”。
七个维度同向显著大幅变化。这是阳明 33 年人格史上唯一一次 7 维同步重组。
1.4.2 处变能力 的来源拆解
唯一反向显著的是处变能力 。这个数字需要按前文体裁混淆误区的原则诚实解读。
1506 前 pre-period 主要是奏疏体裁,“处变能力”的正向标记(“臣闻”、“切详”、“据查”)是奏疏的官式套语,密度天然高。1506 后 post-period 主要是诗、文录、续编书信,这些体裁基本不出现”臣闻”这种朝廷文书用词。所以 的偏离至少一部分由体裁切换造成,不能完全归因到阳明本人的处变能力下降。
其他 6 个正向显著维度受体裁影响较小,因为它们的正向标记词在多个体裁里都出现。这就是为什么我们仍能相信情感深度 、自我修正 、反权威 这些信号是真实的人格重组,不是体裁伪相关。
1.4.3 多维度联合一致性作为证据强度
单一维度若只有一个显著效应,可能是巧合。但 6 个相互独立的维度同时在 1506 之后向同一方向偏离,联合概率极低。若每个维度独立 ,6 个维度全显著的联合 值上界是 。即使考虑维度之间存在弱相关,这个证据强度也远超”虚假显著”能解释的范围。
1.5 阳明三阶段演化:沉默期、危机触发、后期稳定
1506 事件触发的人格重组在数据上已经确证。本节把这个发现放在阳明 33 年的全程时间线上,回答更上一层的问题:阳明一生的人格演化结构是什么样?
1.5.1 总扰动比较
把每个事件触发的总扰动定义为 8 维度因果效应绝对值之和:
其中 是事件年份, 是事件 对第 个维度的 ITS 估计。 越大,说明该事件触发的人格扰动越大。
5 个候选 treatment 的总扰动列在下表。
| 事件 | 年份 | 总扰动 | 显著维度数 |
|---|---|---|---|
| 廷杖几死贬龙场 | 1506 | 27.70 | 7 |
| 龙场悟道 | 1508 | 14.29 | 4 |
| 徐爱卒 | 1517 | 9.49 | 3 |
| 平宁王之乱 | 1519 | 9.24 | 2 |
| 致良知正式提出 | 1521 | 6.36 | 1 |
1506 的总扰动是后期 4 个事件平均(9.85)的 2.81 倍。“致良知”的扰动反而最低,这印证了前文内生 treatment 误区的判断 —— 提出新主张是结果不是原因,不会在人格维度上额外触发显著效应。
1.5.2 三阶段的特征对比
把 1496–1528 这 33 年按 1506 切分为三阶段:
沉默期(1496–1505):阳明 24–33 岁,朝廷下层小官。这 10 年的文本主要是奏疏体,人格特征官式而平淡。反权威平均 (谦卑),情感深度平均 (克制),自我修正几乎为零。这是一个未分化、未觉醒的青年阳明。
危机触发(1506):正德元年这一年。廷杖几死、被刘瑾派人追杀途中跳水脱身、贬贵州龙场驿丞。身体几乎死、政治几乎死、关系几乎死。触发了 7 个维度同时显著的一次性重组。
后期稳定(1508–1528):1508 年龙场悟道之后到 1528 年卒。这 20 年里发生了 1517 徐爱卒、1519 平宁王、1521 致良知、1527 天泉证道四件大事,但每件的总扰动都远小于 1506。它们是阐发阶段,不是重组阶段。
1.5.3 可视化
下图把三阶段公式在数据上完整画出来。(a) 是 8 维度的年份归一化轨迹与三阶段背景;(b) 是 5 事件的总扰动排序;(c) 是 1506 ITS 详图。三个子图合起来构成了”阳明成长公式”的完整证据链。
1.5.4 对哲学史叙事的修正
主流阳明研究把”龙场悟道”当作心学起点。本章数据修正了这个叙事:龙场悟道是 1506 触发的人格重组在 1508 年沉淀出来的智识总结,1506 才是真正的触发点。
1521 致良知同样不是分水岭。它的总扰动仅 6.36,在 5 个候选 treatment 中最低。致良知是阳明给已经完成的人格重组取的一个名字,不是触发人格变化的原因。这条修正与历史学界讨论已久的”龙场悟道是不是过度浪漫化”的疑问吻合,但本章用定量证据把”龙场是结果不是触发点”这件事钉死了。
为什么哲学史叙事会和数据冲突?哲学史叙事关心的是思想的命名时刻 —— 龙场悟道是阳明自己宣告”圣人之道吾性自足”的那一刻 原文出自《年谱》卷一正德三年(1508)条:“忽中夜大悟格物致知之旨,寤寐中若有人语之者,不觉呼跃,从者皆惊。始知圣人之道,吾性自足,向之求理于事物者误也。“ ,致良知是他自己宣告”以三字总括一生学问”的那一刻。这些命名时刻叙事性强,容易被传记体追述记住。但命名时刻和真正触发心态转变的时刻可以隔几年甚至几十年。数据告诉你触发点是 1506,命名时刻是 1508 和 1521。
1.6 方法卡:单人因果推断的边界
1.6.1 尚未解决的问题
本章已经回答了”哪个事件触发了阳明的人格重组”。但仍有几个问题留给后续章节:
第一,1506 重组之后,1508 年龙场悟道为什么专门强化教学耐心(+4.25,)和实践导向?这要回到他在龙场的处境分析。
第二,1521 年提致良知为什么没有人格扰动却有概念上的大跳跃?“致良知”作为概念的诞生与作为人格变化的事件,是两件事。第三章(概念分布散度)会用 L1 与 JS 散度回到这个问题。
第三,跨体裁人格画像差异巨大,奏疏里的阳明、诗里的阳明、教学时的阳明几乎是 6 个不同的人。这是体裁混淆还是真的人格场景化?第六章(跨体裁人格分析)用体裁固定效应回归处理这个问题。
1.7 本章知识地图
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 人格维度净分 | 正向标记减反向标记的每千字密度 | 标记词越多越准 | 标记词与体裁套语混杂时反而引入伪信号 |
| 中断时间序列 | pre-trend OLS 外推得反事实,差额作因果效应 | 9 个时间点就能做 ITS | pre 自由度 时 值不可信,是小样本下方差被低估 |
| 反事实平行假设 | 若事件没发生 pre-trend 会按相同斜率延伸 | 假设可以直接检验 | 反事实永远观测不到,只能用多维度联合一致性间接支撑 |
| 外生 treatment | 个体无法选择是否发生 | 阳明自己的思想动作可作 treatment | 内生事件估出来的是反向因果,不是真因果 |
| 体裁混淆 | 跨体裁差异部分由语言习惯造成 | 跨体裁分数差异直接归因到人格 | 奏疏体的官式套语会污染处变能力等维度 |
| 多维联合一致性 | 多个独立维度同向显著 | 单维度显著就够了 | 单人因果推断没有 between-subject 实验,联合一致性是替代证据 |