概念分布散度:李鸿章与左宗棠作为双外部历史对照

用 JS / L1 散度衡量曾国藩家书 31 年话语演化的总幅度,引入李鸿章与左宗棠两个外部对照,把单轴距离演化升级为二维参照空间内的轨迹漂移。

本章要回答的

用 JS / L1 散度衡量曾国藩家书 31 年话语演化的总幅度,引入李鸿章(弟子,洋务实业派)与左宗棠(同袍,保守变法派)作为双外部对照基线,把单轴距离演化升级为二维参照空间内的轨迹漂移。给出 P1 翰林期 → P2 创湘军 JS = 0.1383 这一最大过渡,与 1853 创湘军 ITS 信号同源。

第 1 章 ITS 给出 1853 / 1860 / 1864 三个候选 treatment 在 7 个关键序列上的局部效应估计。本章用概念分布散度直接刻画曾国藩 31 年话语演化的整体形状,并引入李鸿章左宗棠两个外部对照,看曾国藩的演化是否真的是曾国藩独有,还是晚清朝臣共有

2.1 研究问题与时段切分

按本书的 treatment 节点把家书 31 年切为 5 时段。1853 / 1860 / 1864 / 1870 四个候选 treatment 年作为过渡年单独剔除。

时段年份范围说明封数
P1 翰林期1841–1852京官学者,修身日课145
P2 创湘军1854–1859衡州誓师,湘潭大捷,湖口大败231
P3 安庆天京1861–1864围安庆,攻克天京700
P4 办洋务1865–1869湘军裁撤,转向洋务207
P5 教案晚年1871–1872天津教案后(含 1871 + 1872 卒前)26

P5 仅 26 封,估计精度比其他时段低,后续读到 P5 数字时须带这条 caveat。


2.2 JS / L1 散度的定义

两种散度互相 cross-check:如果两者方向一致,结论稳健;如果一者偏离另一者,说明是被单一高频概念牵着走的 artifact。


2.3 曾国藩内部 4 个过渡的散度

过渡JS
P1 翰林期 → P2 创湘军0.1383
P2 创湘军 → P3 安庆天京0.0652
P3 安庆天京 → P4 办洋务0.0732
P4 办洋务 → P5 教案晚年0.0667

最大过渡是 P1 → P2(JS = 0.1383,翰林期到创湘军的过渡),与第 1 章 ITS 1853 强信号同源。1853 创湘军把曾国藩从京官修身切换到湘军统帅,话语整体分布发生 2 倍于其他过渡的剧烈漂移。

剩下三个过渡 P2 → P3、P3 → P4、P4 → P5 的 JS 都在 0.06–0.08 之间,大致相当。这说明曾国藩 1854 之后的话语演化是平稳渐变,没有第二次出现 1853 那种话语断裂。攻克天京(1864)、转洋务(1865)、教案晚年(1870)都没有改变曾国藩家书话语的整体分布形状,即使第 1 章 ITS 在单一维度(战事、教化)上看到显著跳跃。

这条结果意味着:曾国藩晚年的话语演化是局部维度的逐次切换,不是整体话语系统的反复重组。与阳明 1506 廷杖、苏轼 1080 谪黄州两个 case 在主时段过渡都有较大 JS 不同,曾国藩案例的话语断裂只发生一次,而且在 1853 而非传统强调的 1864 攻克天京。


2.4 曾国藩 vs 双外部对照的二维参照空间

李鸿章《选集》432,575 字、左宗棠《奏牍》77,189 字作为外部对照基线。曾国藩每个时段相对两人的 JS 散度构成二维坐标。

时段JS(vs 李鸿章)JS(vs 左宗棠)n
P1 翰林期0.45470.5334145
P2 创湘军0.29210.3146231
P3 安庆天京0.26850.2660700
P4 办洋务0.26850.2985207
P5 教案晚年0.34300.405226

v2 数据下二维参照空间的轨迹呈现 U 型曲线。

P1 翰林期距双对照都最远:JS(曾 P1, 李) = 0.45,JS(曾 P1, 左) = 0.53。翰林期曾国藩家书话语是修身 + 教化型,与李左两人的奏牍语境完全不同。李奏牍谈洋务机械,左奏牍谈军务边事,这些都不是翰林期曾国藩家书的话题。

P2 创湘军后距双对照都拉近:P2 JS(李) 降到 0.29,JS(左) 降到 0.31。进入军务话语后,曾国藩开始谈兵谈饷谈战,与李左奏牍话题对齐,距离缩小约 30%。

P3 安庆天京距双对照最近:JS(李) = JS(左) = 0.27,是 5 个时段中距离最小的。这一段曾国藩在湖南、安庆、南京前线连续作战,家书话语完全军务化,与同期李左奏牍同质。

P4 办洋务期距对照基本持平 P3:JS(李) 仍是 0.27,JS(左) 升到 0.30。这与曾国藩 1865 后转入江南办洋务一致,与李鸿章话语保持同步,但与左宗棠(此时正在征西北)拉开一点。

P5 教案晚年距双对照又拉远:JS(李) 升到 0.34,JS(左) 升到 0.41。这条反弹与晚年家书重心从国事退回家事有关(见第 1 章 1870 教案均值比较),教化 / 家族 / 隐逸三主题词频上升,与奏牍语境拉开。但要注意 P5 仅 26 封,估计噪声大。

为什么 P1 翰林期距同代朝臣最远,P3 安庆天京反而最近?直觉上 P1 京官期与李左两人(同为朝廷重臣)的话语应当接近。但数据告诉我们,翰林期曾国藩的家书不是奏牍,是私人修身教化文本,与奏牍体的话题分布根本不同。进入 P2 P3 湘军期后,曾国藩家书变成军务讨论 + 家训的混合体,军务话题让它向奏牍体靠拢。这条变化反过来说明:文体差异时代背景对话语距离的影响更大。


2.5 本章知识地图

核心概念核心内容常见误解为什么错
双外部对照李鸿章 + 左宗棠以为对照必须异质同源不同发也能识别个体差异
P1 → P2 散度最大JS = 0.1383以为 1864 / 1870 也是大过渡1853 创湘军是唯一话语断裂
P1 翰林期距双对照最远JS(李) = 0.45,JS(左) = 0.53以为同代朝臣距离应近家书 vs 奏牍体裁差异大
P3 安庆天京距双对照最近JS = 0.27以为前线最远军务话题让家书向奏牍体靠拢
Parity 0.05李 vs 左 JS 极小以为对照独立同为奏牍体,双对照实质退化为单对照
P5 教案晚年噪声大仅 26 封以为可以直接 claim 反弹小样本散度估计不可靠

参考文献