本章目录
本章目录
把每个时段的概念使用情况编码成一个概率分布;用 L1 距离与 Jensen–Shannon 散度衡量相邻时段的分布差异;用 200 次内部随机切两半给出”什么都没变”的噪声基线;用朱熹《朱子语类》600 万字作为外生历史对照,看阳明思想离朱子学派有多远、怎么演化。
上一章 ITS 估的是”事件触发了什么”。但 ITS 有一个天然的局限:它假设事件的时间已知,然后量化事件前后的偏离。本章换一个角度:不预设事件时间,直接看相邻时段的整体话语分布差异。这条路可以反过来验证 ITS 的事件识别是否对得上数据本身。
本章主要回答三个问题:第一,阳明 6 时段间相邻的两两过渡里,哪一次跳跃最大?第二,这个最大跳跃是不是统计意义上的真信号,还是单纯抽样噪声?第三,朱熹作为一个完全外生于阳明任何事件的 300 年前的对照,阳明在哪些时段离他最远?
2.1 从单被试时间序列到分布对比
2.1.1 单变量 ITS 与整体分布的互补关系
中断时间序列研究的是”一个变量沿时间的轨迹”。本章研究的是”整个概念分布随时间的演化”。这两件事互补:前者给出单一概念的精细动态,后者给出整体话语结构的全景。
2.1.2 概念分布的形式定义
通俗讲, 表示”时段 里,一个随机抽到的字属于概念 的概率”。 是”抽到的字不属于任何关注的概念”的概率。
为什么这样定义而不是用次数比例?次数比例 把所有概念归一化到 1,但忽略了概念字符长度。“致良知”一次出现等于 3 个字,“性”一次出现等于 1 个字。用 把这两者按字符贡献量公平比较。分母用 是因为这样得到的 直接刻画”时段总字数里多少比例属于这个概念”,跨时段可比。
2.2 衡量两个分布距离:L1 与 JS 散度
2.2.1 两种标准散度指标
有了 ,下一步是衡量两个相邻时段 与 的差。有两种标准选择:L1 距离与 Jensen–Shannon 散度。
2.2.2 L1 与 JS 的差异与互补性
L1 直观但对小概率事件不敏感;JS 把概率比放进对数,对小概率变化更敏感。两个互补的指标。
为什么不用 KL 散度直接当指标?KL 不对称,,在”比较两个分布的距离”这种需要对称性的场合不合适。JS 通过加权两端 KL 得到对称指标,是处理对称比较的标准做法。
本章主结论
2.3 阳明 6 时段过渡的散度:T3 → T4 是最大跳跃
2.3.1 12 个核心概念的频率轨迹
把 51 个概念分布算到 6 个时段,得到 5 个相邻过渡的 L1 与 JS,列在下表。在看汇总表之前先看下图,它把 12 个核心概念在 6 时段每千字的频率画在一起,给读者一个”什么在变”的视觉直觉。
| 过渡 | L1 | JS() | 新现概念 | 退场概念 |
|---|---|---|---|---|
| T1(徐爱期)→ T2(陆澄期) | 0.0382 | 0.0106 | 1 | 1 |
| T2(陆澄期)→ T3(薛侃期) | 0.0356 | 0.0065 | 0 | 1 |
| T3(薛侃期)→ T4(卷中书信期) | 0.0685 | 0.0205 | 2 | 3 |
| T4(卷中书信期)→ T5(中后期门人录) | 0.0455 | 0.0115 | 0 | 0 |
| T5(中后期门人录)→ T6(晚年定型期) | 0.0342 | 0.0066 | 0 | 0 |
2.3.2 T3 → T4 跳跃在三个指标上的一致性
T3 → T4 在所有三个指标上同时最大:L1 是其他过渡的 1.5 到 2 倍,JS 是其他过渡的 2 到 3 倍,新现与退场概念加起来 5 个(占全部 8 个事件的 62.5%)。
下表列出 T3 → T4 的具体概念事件。下图把 5 个过渡里所有概念的新现 / 退场事件画成一张网格图,可以一眼看出 T3 → T4 这一行事件密度最高。
| 方向 | 概念 | 类别 | T3 频率 | T4 频率 |
|---|---|---|---|---|
| 新现 | 致良知 | 心学纲领 | 0.00 | 0.79 |
| 新现 | 朱子 | 辩论对象 | 0.00 | 0.64 |
| 退场 | 人欲 | 传统改造 | 1.19 | 0.08 |
| 退场 | 克己 | 阳明特色 | 0.71 | 0.00 |
| 退场 | 先儒 | 辩论对象 | 0.71 | 0.00 |
为什么是这 5 个事件共同出现?“致良知”进入文本与”朱子”重回议程几乎同时发生,而”人欲""克己""先儒”同时退场。这五个事件构成一个连贯的话语切换:阳明从程朱学派的”存天理灭人欲”框架,切换到自己的”致良知”框架;与此同时,他从沉默期重新开始系统讨论朱子。这条切换在文本上一次性完成,时间集中在 1521 年前后。
2.4 内部基线:抽样波动的散度尺度
2.4.1 为什么需要内部基线
T3 → T4 的 L1 = 0.0685 听起来不小,但相对于什么基线?我们需要知道”如果什么都没变,仅由抽样波动会造出多大的散度”。这是判断 0.0685 是否真信号的关键。
2.4.2 6 个时段的 95% 上界与 T3 → T4 的比较
对 6 个时段各跑 200 次随机切两半的结果列在下表。
| 时段 | 条目数 | L1 均值 | L1 95% 上界 |
|---|---|---|---|
| T1 徐爱期 | 14 | 0.0701 | 0.0935 |
| T2 陆澄期 | 81 | 0.0469 | 0.0634 |
| T3 薛侃期 | 35 | 0.0608 | 0.0863 |
| T4 卷中书信期 | 70 | 0.0346 | 0.0502 |
| T5 中后期门人录 | 47 | 0.0491 | 0.0658 |
| T6 晚年定型期 | 96 | 0.0371 | 0.0535 |
这一组数字给出诚实的结论:T3 → T4 的实际散度 0.0685,仍在 T1 与 T3 内部基线 95% 上界之下。换句话说,T3 → T4 的整体分布差异不显著超过同一个阳明被随机切两半能造出的差异。
下图把 5 个相邻过渡的 L1 与各时段的内部基线 95% 上界画在一起,可以直接看到 T3 → T4 这一柱仍在基线之下。
2.5 L1 不显著与 ITS 显著的尺度差异
2.5.1 两种方法看似矛盾的结论
读到这里读者会有疑问:第 1 章的 ITS 给出 1506 廷杖触发了 7 维显著的因果效应,本章的 L1 散度却说阳明 6 时段间所有过渡都不显著高于内部基线。这两者矛盾吗?
不矛盾,是两个层次的事。
2.5.2 聚合指标的稀释机制
L1 散度衡量的是 51 个概念整体的分布差异。绝大多数概念在所有时段都被频繁使用(譬如”性""仁""义”),这些高频稳定概念占了分布总质量的大头,把整体距离的尺度撑得很大。少数关键概念(致良知 / 朱子 / 人欲)的事件性变化,在整体距离里被高频稳定项稀释了。
2.5.3 ITS 对单变量的精细化
ITS 是针对单一关键变量的事件研究。当我们针对”致良知”这一个序列做 ITS,高频稳定概念不参与计算,关键事件的信号不被稀释。这是 ITS 能看到 L1 看不到的信号的根本原因。
这个对比给我们一个重要方法论提示:单一聚合指标(L1)与针对性事件研究(ITS)不能互相替代。要做严肃的因果推断,必须看具体概念事件,不能只看整体分布距离。
2.6 朱熹作为外生历史对照
到目前为止本章的分析都在阳明语料内部展开。阳明的概念分布相对什么参照?我们需要一个外部对照,它不受阳明任何事件影响,同时与阳明属于同一思想传统,能进行有意义的比较。
朱熹(1130–1200)是理想的对照。距离阳明(1472–1529)整整 300 年,朱熹完全不受阳明 1519 平宁王或 1521 致良知事件影响,这件事是逻辑上的外生性。同时朱熹与阳明都在儒家传统内,共享 51 个核心概念中的绝大部分,“性""仁""义""格物""致知""诚意""天理""人欲”等术语两人都用,分布对比有意义。
2.6.1 朱子语类的语料规模
我们使用《朱子语类》崇文书局 2018 年点校本,共 8 册 140 卷,约 597 万字纯古典原文。这个语料比阳明全集(611K 字)多约 10 倍,是朱熹一生与门人对话的最完整记录。
| 概念 | 朱子语类频率 | 阳明全集频率 | 阳明 / 朱熹比 |
|---|---|---|---|
| 天理 | 2.31 | 1.87 | 0.81 |
| 人欲 | 1.94 | 0.57 | 0.29 |
| 格物 | 3.42 | 1.40 | 0.41 |
| 致知 | 1.78 | 1.05 | 0.59 |
| 诚意 | 1.21 | 0.71 | 0.59 |
| 性 | 8.15 | 4.32 | 0.53 |
| 仁 | 5.78 | 2.95 | 0.51 |
| 义 | 4.21 | 2.18 | 0.52 |
| 心 | 9.34 | 12.85 | 1.38 |
| 良知 | 0.32 | 4.17 | 13.0 |
| 致良知 | 0.00 | 0.37 | --- |
| 心即理 | 0.02 | 0.13 | 6.5 |
这张表给出一个直接量化的”心学远离理学”图景:
- 第一组(天理、人欲、格物、致知、诚意、性、仁、义):阳明使用频率约为朱熹的一半。这些是程朱框架的核心术语,阳明仍在用,但密度显著降低。
- 第二组(心、良知、致良知、心即理):阳明使用频率显著高于朱熹,其中”良知”是朱熹的 13 倍。“心即理”阳明用 6.5 倍。这些是心学纲领词,在朱熹那里几乎不用,在阳明这里被中心化。
这一组对比给出了”理学话语 → 心学话语”的量化定义:理学话语 = 高”天理 / 人欲 / 格物”密度 + 低”良知 / 致良知 / 心即理”密度;心学话语 = 反过来。阳明全集(取所有时段平均)已经是”心学话语”一边,但他从早期到晚期是不是越来越远离”理学话语”这一极,是下一节要回答的。
2.6.2 阳明 6 时段距离朱熹的演化
把朱熹的概念分布 作为参照,算阳明 6 时段各自的 L1 距离 ,列在下表。
| 时段 | 年份 | L1 距离朱熹 | 相对 T1 变化 |
|---|---|---|---|
| T1 徐爱期 | 1512–1517 | 0.143 | --- |
| T2 陆澄期 | 1515–1521 | 0.165 | +0.022 |
| T3 薛侃期 | 1519–1522 | 0.178 | +0.035 |
| T4 卷中书信期 | 1518–1527 | 0.214 | +0.071 |
| T5 中后期门人录 | 1515–1528 | 0.198 | +0.055 |
| T6 晚年定型期 | 1521–1528 | 0.226 | +0.083 |
阳明从早期到晚期,一路远离朱熹,总位移 +0.083。跨过 T3 → T4 的最大跳跃 +0.036 对应着 1521 年致良知话语进入文本。T4 → T5 略有回落,T5 → T6 重新拉开,这与晚年阳明把致良知教得越来越极端的史实一致。
这条距离曲线是 ITS 论点的外部独立验证:ITS 给出”1506 廷杖触发了 7 维内部重组”,跨思想家距离曲线给出”阳明逐步从朱熹立场迁移到自己立场,最大单步迁移发生在 T3 → T4”。两条独立证据指向同一个时间节点(1521 前后),互相支撑。
2.7 方法卡
2.8 本章知识地图
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 概念分布 | 每个时段的概念字符占比构成概率分布 | 按出现次数归一化即可 | 忽略概念字符长度会让”致良知”与”心”不公平比较 |
| L1 距离 | 两分布概率质量差的总和 | L1 = 0.07 听起来大 | 整体被高频稳定项稀释,单看 L1 数值会高估效应 |
| JS 散度 | 双向 KL 的对称版本 | JS 与 L1 测量同一件事 | JS 对小概率敏感,L1 对大概率敏感,两者互补 |
| 内部基线 | 同时段切两半重复 200 次的散度分布 | 内部应该接近零 | 小样本时段抽样波动很大,基线远大于零 |
| 新现 / 退场事件 | 阈值化的概念出现 / 消失检测 | 只看 L1 就够 | 事件级证据比 L1 整体值更可解释、可追溯 |
| 外生历史对照 | 用 300 年前的朱熹作参照 | 对照必须同期 | 历史外生对照逻辑上不受 treated 任何事件影响,比同期对照更干净 |