概念分布散度:朱熹作为外生历史对照

把 12 个核心概念在 6 时段的密度做 L1/JS 散度分析,识别致良知诞生前后的话语重组节点。

本章要回答的

把每个时段的概念使用情况编码成一个概率分布;用 L1 距离与 Jensen–Shannon 散度衡量相邻时段的分布差异;用 200 次内部随机切两半给出”什么都没变”的噪声基线;用朱熹《朱子语类》600 万字作为外生历史对照,看阳明思想离朱子学派有多远、怎么演化。

上一章 ITS 估的是”事件触发了什么”。但 ITS 有一个天然的局限:它假设事件的时间已知,然后量化事件前后的偏离。本章换一个角度:不预设事件时间,直接看相邻时段的整体话语分布差异。这条路可以反过来验证 ITS 的事件识别是否对得上数据本身。

本章主要回答三个问题:第一,阳明 6 时段间相邻的两两过渡里,哪一次跳跃最大?第二,这个最大跳跃是不是统计意义上的真信号,还是单纯抽样噪声?第三,朱熹作为一个完全外生于阳明任何事件的 300 年前的对照,阳明在哪些时段离他最远?

2.1 从单被试时间序列到分布对比

2.1.1 单变量 ITS 与整体分布的互补关系

中断时间序列研究的是”一个变量沿时间的轨迹”。本章研究的是”整个概念分布随时间的演化”。这两件事互补:前者给出单一概念的精细动态,后者给出整体话语结构的全景。

2.1.2 概念分布的形式定义

通俗讲,πp(c)\pi_p(c) 表示”时段 pp 里,一个随机抽到的字属于概念 cc 的概率”。πp(其他)\pi_p(\text{其他}) 是”抽到的字不属于任何关注的概念”的概率。

为什么这样定义而不是用次数比例?次数比例 nc,p/cnc,pn_{c,p} / \sum_c n_{c,p} 把所有概念归一化到 1,但忽略了概念字符长度。“致良知”一次出现等于 3 个字,“性”一次出现等于 1 个字。用 nc,pcn_{c,p} \cdot |c| 把这两者按字符贡献量公平比较。分母用 CpC_p 是因为这样得到的 πp\pi_p 直接刻画”时段总字数里多少比例属于这个概念”,跨时段可比。


2.2 衡量两个分布距离:L1 与 JS 散度

2.2.1 两种标准散度指标

有了 πp\pi_p,下一步是衡量两个相邻时段 πp\pi_pπp+1\pi_{p+1} 的差。有两种标准选择:L1 距离与 Jensen–Shannon 散度。

2.2.2 L1 与 JS 的差异与互补性

L1 直观但对小概率事件不敏感;JS 把概率比放进对数,对小概率变化更敏感。两个互补的指标。

为什么不用 KL 散度直接当指标?KL 不对称,KL(ππ)KL(ππ)\text{KL}(\pi \| \pi') \neq \text{KL}(\pi' \| \pi),在”比较两个分布的距离”这种需要对称性的场合不合适。JS 通过加权两端 KL 得到对称指标,是处理对称比较的标准做法。


本章主结论

2.3 阳明 6 时段过渡的散度:T3 → T4 是最大跳跃

2.3.1 12 个核心概念的频率轨迹

把 51 个概念分布算到 6 个时段,得到 5 个相邻过渡的 L1 与 JS,列在下表。在看汇总表之前先看下图,它把 12 个核心概念在 6 时段每千字的频率画在一起,给读者一个”什么在变”的视觉直觉。

12 个核心概念在阳明 6 时段每千字的出现频率。"致良知"与"良知"在 T4(1521 前后)出现明显跃升,"人欲""克己""先儒"在同一时段显著退场。高频稳定概念("性""仁""义")在所有时段密度近似,提供基线参照。

过渡L1JS(log2\log_2新现概念退场概念
T1(徐爱期)→ T2(陆澄期)0.03820.010611
T2(陆澄期)→ T3(薛侃期)0.03560.006501
T3(薛侃期)→ T4(卷中书信期)0.06850.020523
T4(卷中书信期)→ T5(中后期门人录)0.04550.011500
T5(中后期门人录)→ T6(晚年定型期)0.03420.006600

2.3.2 T3 → T4 跳跃在三个指标上的一致性

T3 → T4 在所有三个指标上同时最大:L1 是其他过渡的 1.5 到 2 倍,JS 是其他过渡的 2 到 3 倍,新现与退场概念加起来 5 个(占全部 8 个事件的 62.5%)。

下表列出 T3 → T4 的具体概念事件。下图把 5 个过渡里所有概念的新现 / 退场事件画成一张网格图,可以一眼看出 T3 → T4 这一行事件密度最高。

方向概念类别T3 频率T4 频率
新现致良知心学纲领0.000.79
新现朱子辩论对象0.000.64
退场人欲传统改造1.190.08
退场克己阳明特色0.710.00
退场先儒辩论对象0.710.00

5 个相邻时段过渡里每个概念的新现 / 退场状态。横轴为概念按类别分组,纵轴为 5 个时段过渡。绿色单元格表示该过渡里这个概念新现,紫色表示退场,灰色表示维持稳定。T3 → T4 这一行集中了 5 个事件(2 新现 + 3 退场),远高于其他过渡。

为什么是这 5 个事件共同出现?“致良知”进入文本与”朱子”重回议程几乎同时发生,而”人欲""克己""先儒”同时退场。这五个事件构成一个连贯的话语切换:阳明从程朱学派的”存天理灭人欲”框架,切换到自己的”致良知”框架;与此同时,他从沉默期重新开始系统讨论朱子。这条切换在文本上一次性完成,时间集中在 1521 年前后。


2.4 内部基线:抽样波动的散度尺度

2.4.1 为什么需要内部基线

T3 → T4 的 L1 = 0.0685 听起来不小,但相对于什么基线?我们需要知道”如果什么都没变,仅由抽样波动会造出多大的散度”。这是判断 0.0685 是否真信号的关键。

2.4.2 6 个时段的 95% 上界与 T3 → T4 的比较

对 6 个时段各跑 200 次随机切两半的结果列在下表。

时段条目数L1 均值L1 95% 上界
T1 徐爱期140.07010.0935
T2 陆澄期810.04690.0634
T3 薛侃期350.06080.0863
T4 卷中书信期700.03460.0502
T5 中后期门人录470.04910.0658
T6 晚年定型期960.03710.0535

这一组数字给出诚实的结论:T3 → T4 的实际散度 0.0685,仍在 T1 与 T3 内部基线 95% 上界之下。换句话说,T3 → T4 的整体分布差异不显著超过同一个阳明被随机切两半能造出的差异

下图把 5 个相邻过渡的 L1 与各时段的内部基线 95% 上界画在一起,可以直接看到 T3 → T4 这一柱仍在基线之下。

阳明 6 时段间 5 个相邻过渡的 L1 / JS 散度,与各时段内部基线 95% 上界对比。T3 → T4 在三个指标上同时最大,但仍未超过 T1 与 T3 时段内部"随机切两半"能造出的噪声尺度,说明整体分布差异需要结合具体概念事件来解释。


2.5 L1 不显著与 ITS 显著的尺度差异

2.5.1 两种方法看似矛盾的结论

读到这里读者会有疑问:第 1 章的 ITS 给出 1506 廷杖触发了 7 维显著的因果效应,本章的 L1 散度却说阳明 6 时段间所有过渡都不显著高于内部基线。这两者矛盾吗?

不矛盾,是两个层次的事。

2.5.2 聚合指标的稀释机制

L1 散度衡量的是 51 个概念整体的分布差异。绝大多数概念在所有时段都被频繁使用(譬如”性""仁""义”),这些高频稳定概念占了分布总质量的大头,把整体距离的尺度撑得很大。少数关键概念(致良知 / 朱子 / 人欲)的事件性变化,在整体距离里被高频稳定项稀释了。

2.5.3 ITS 对单变量的精细化

ITS 是针对单一关键变量的事件研究。当我们针对”致良知”这一个序列做 ITS,高频稳定概念不参与计算,关键事件的信号不被稀释。这是 ITS 能看到 L1 看不到的信号的根本原因。

这个对比给我们一个重要方法论提示:单一聚合指标(L1)与针对性事件研究(ITS)不能互相替代。要做严肃的因果推断,必须看具体概念事件,不能只看整体分布距离。


2.6 朱熹作为外生历史对照

到目前为止本章的分析都在阳明语料内部展开。阳明的概念分布相对什么参照?我们需要一个外部对照,它不受阳明任何事件影响,同时与阳明属于同一思想传统,能进行有意义的比较。

朱熹(1130–1200)是理想的对照。距离阳明(1472–1529)整整 300 年,朱熹完全不受阳明 1519 平宁王或 1521 致良知事件影响,这件事是逻辑上的外生性。同时朱熹与阳明都在儒家传统内,共享 51 个核心概念中的绝大部分,“性""仁""义""格物""致知""诚意""天理""人欲”等术语两人都用,分布对比有意义。

2.6.1 朱子语类的语料规模

我们使用《朱子语类》崇文书局 2018 年点校本,共 8 册 140 卷,约 597 万字纯古典原文。这个语料比阳明全集(611K 字)多约 10 倍,是朱熹一生与门人对话的最完整记录。

概念朱子语类频率阳明全集频率阳明 / 朱熹比
天理2.311.870.81
人欲1.940.570.29
格物3.421.400.41
致知1.781.050.59
诚意1.210.710.59
8.154.320.53
5.782.950.51
4.212.180.52
9.3412.851.38
良知0.324.1713.0
致良知0.000.37---
心即理0.020.136.5

这张表给出一个直接量化的”心学远离理学”图景

  • 第一组(天理、人欲、格物、致知、诚意、性、仁、义):阳明使用频率约为朱熹的一半。这些是程朱框架的核心术语,阳明仍在用,但密度显著降低。
  • 第二组(心、良知、致良知、心即理):阳明使用频率显著高于朱熹,其中”良知”是朱熹的 13 倍。“心即理”阳明用 6.5 倍。这些是心学纲领词,在朱熹那里几乎不用,在阳明这里被中心化。

这一组对比给出了”理学话语 → 心学话语”的量化定义:理学话语 = 高”天理 / 人欲 / 格物”密度 + 低”良知 / 致良知 / 心即理”密度心学话语 = 反过来。阳明全集(取所有时段平均)已经是”心学话语”一边,但他从早期到晚期是不是越来越远离”理学话语”这一极,是下一节要回答的。

2.6.2 阳明 6 时段距离朱熹的演化

把朱熹的概念分布 π\pi_{\text{朱}} 作为参照,算阳明 6 时段各自的 L1 距离 L1(πp,π)\text{L1}(\pi_p, \pi_{\text{朱}}),列在下表。

时段年份L1 距离朱熹相对 T1 变化
T1 徐爱期1512–15170.143---
T2 陆澄期1515–15210.165+0.022
T3 薛侃期1519–15220.178+0.035
T4 卷中书信期1518–15270.214+0.071
T5 中后期门人录1515–15280.198+0.055
T6 晚年定型期1521–15280.226+0.083

阳明从早期到晚期,一路远离朱熹,总位移 +0.083。跨过 T3 → T4 的最大跳跃 +0.036 对应着 1521 年致良知话语进入文本。T4 → T5 略有回落,T5 → T6 重新拉开,这与晚年阳明把致良知教得越来越极端的史实一致。

这条距离曲线是 ITS 论点的外部独立验证:ITS 给出”1506 廷杖触发了 7 维内部重组”,跨思想家距离曲线给出”阳明逐步从朱熹立场迁移到自己立场,最大单步迁移发生在 T3 → T4”。两条独立证据指向同一个时间节点(1521 前后),互相支撑。


2.7 方法卡


2.8 本章知识地图

核心概念核心内容常见误解为什么错
概念分布每个时段的概念字符占比构成概率分布按出现次数归一化即可忽略概念字符长度会让”致良知”与”心”不公平比较
L1 距离两分布概率质量差的总和L1 = 0.07 听起来大整体被高频稳定项稀释,单看 L1 数值会高估效应
JS 散度双向 KL 的对称版本JS 与 L1 测量同一件事JS 对小概率敏感,L1 对大概率敏感,两者互补
内部基线同时段切两半重复 200 次的散度分布内部应该接近零小样本时段抽样波动很大,基线远大于零
新现 / 退场事件阈值化的概念出现 / 消失检测只看 L1 就够事件级证据比 L1 整体值更可解释、可追溯
外生历史对照用 300 年前的朱熹作参照对照必须同期历史外生对照逻辑上不受 treated 任何事件影响,比同期对照更干净

参考文献