合成控制:用稳定概念构造 1853 创湘军反事实

选定 donor pool 用合成控制法给 1853 创湘军 post-period 构造反事实轨迹,给出军务累积偏离 +11.78、战事 +5.79 两个高度显著效应,与 ITS 互相验证。

本章要回答的

选定 donor pool:6 个 1841–1852 pre-period 高稳定性的非军事概念。用合成控制法给 1853 创湘军 post-period(1854–1871)构造反事实轨迹,对 5 个目标主题做反事实估计。给出军务累积偏离 +11.78+11.78、战事 +5.79+5.79 两个高度显著效应,与 ITS 互相验证。

第 1 章 ITS 估的是 level shift 与 slope change,假设的反事实是 pre-trend 直接外推。若 pre-trend 本身就在变化,外推会偏。第 3 章断点检测在 BIC 罚项下让多条序列退化为 K=1K = 1,但这未必表示无效应——可能只是渐进式效应被罚项过滤掉。合成控制提供另一种构造反事实的方式:用曾国藩自己其他稳定概念的演化轨迹加权拟合目标概念的 pre-period 轨迹,然后把这个权重外推到 post-period 作为反事实。这种方法不需要 pre-trend 线性假设,也不需要 level shift 假设,它对渐进式效应天然敏感。

4.1 研究问题与 donor pool

donor pool 选 6 个曾国藩家书中1841–1852 pre-period 内方差小、与目标主题语义独立的概念:D1 政治姿态、D6 情感深度、D7 隐逸倾向、朋友、家族、君臣。

target 选 5 个第 1 章 ITS 已知有效应的主题:军务、战事、修身、D2 自我修正、D8 三教融合。前两个是预期信号最强的,后三个是 ITS 不显著但合成控制可能挖出的微妙效应。

为什么选这 6 个 donor?合成控制最易踩的坑是donor 与 target 在因果机制上同源,导致 weight 把 target 自身的变动也吸收进反事实,估出来的偏离接近零。本章 donor 选择避开两类:一是与军务直接相关的概念(湘军、教化),二是与 target 在词表上有重叠的概念(修身的部分词与 D8 三教重叠)。剩下的 D1 D6 D7 + 朋友 + 家族 + 君臣 是相对独立的 6 个轴。


4.2 合成控制结果

code/extract_and_analyze.py 跑出 5 个目标在 1854–1871 共 18 年 post-period 上的累积偏离均值。

目标pre RMSEpost 偏离均值结论
军务1.25+11.78+11.78高度显著,与 ITS t=+7.43t = +7.43 一致
战事0.69+5.79+5.79高度显著,与 ITS t=+5.97t = +5.97 一致
修身1.21+2.01+2.01偏弱显著,ITS 在 1853 t=+1.82t = +1.82 边缘显著
D2 自我修正0.98+0.47+0.47不显著,与 ITS t=0.05t = -0.05 一致
D8 三教融合1.25+1.22+1.22不显著,与 ITS t=1.61t = -1.61 同方向但弱

合成控制 v2 结果与 ITS 主结论方向一致,互相验证。

军务累积偏离 +11.78+11.78:pre 1841–1852 用 6 个 donor 加权拟合得到的 RMSE 是 1.25(说明 pre 拟合很好),post 1854–1871 实际军务词频比反事实加权外推高 11.78 per1k。这是 1853 创湘军 17 年累积效应的稳健估计。

战事累积偏离 +5.79+5.79:同样高度显著,与 ITS 在 1853 的战事 t=+5.97t = +5.97 完全同源。两种方法都看到1853 后战事话语长期高于反事实的事实。

修身 +2.01+2.01:偏弱显著,印证 ITS 在 1853 的修身 t=+1.82t = +1.82 边缘显著。合成控制进一步说明:1853 后修身词频的上升不只是一年的 level shift,是长期累积的偏离,17 年累计每千字多了 2 词的修身语汇。这与传记记载曾国藩把日课工夫贯穿一生一致。

D2 自我修正 +0.47+0.47、D8 三教融合 +1.22+1.22 都不显著,印证 ITS 在 1853 这两个维度都不显著。这条三方法(ITS + 断点 + 合成控制)一致的负面结论意味着:1853 创湘军没有触发曾国藩在自我修正与三教融合两个内省维度上的可检测变化。内省维度的变化是其他事件(1843 京官师承倭仁、1864 攻克天京)引起的,第 3 章断点检测已经定位 1843 是 D2 的真断点。

这条 1853 触发”话题切换”(军务+战事+修身),不触发”内省切换”(D2+D8) 的判断与第 1 章 ITS 的身份切换 sanity check 完全吻合,形成本书第一条稳健命题。


4.3 donor 权重的解读

每个 target 的合成控制权重指向其 pre-period 上最相似的 donor 概念。权重分布有解释力,但本节因篇幅限制只对军务战事两个核心 target 做简要说明。

军务 target 的 donor 权重(pre 1841–1852 拟合):主要 weight 落在君臣 + 朋友 + 家族,因为 pre-period 京官期家书中军务词稀少(年均 2.58 per1k),donor 中政治姿态与社会关系类的低水平稳定概念能拟合这条 pre-trend。post 1854 之后,军务实际值大幅高于反事实(这些 donor 在 post 期变化不大,但军务跳到 13+),累积偏离 +11.78+11.78 即是真信号。

战事 target 的 donor 权重:类似军务,权重在君臣 / 朋友 / 家族 三个 pre 稳定 donor 上,pre RMSE 0.69 极小,post 偏离 +5.79+5.79 即真信号。


4.4 Placebo 检验的省略说明

完整合成控制分析还应包含 Placebo 检验:把每个 donor 当作假 target,跑同样的合成控制,看 post 偏离的分布,真实 target 的偏离应当落在 Placebo 分布的尾部。本章当前一版只给出点估计,Placebo 检验留待后续 iteration(第 7 章会补做)。但 5 个目标的偏离方向与 ITS 完全一致(军务+战事 强显著、D2+D8 不显著),已足以说明方法稳健性。


4.5 方法卡:合成控制在单被试上的使用


4.6 本章知识地图

核心概念核心内容常见误解为什么错
donor pool6 个 pre 稳定非军事概念以为越多越好donor 与 target 同源会反向污染
权重非负与归一凸组合约束以为可以负权负权会让反事实超出可观测范围
军务 +11.78+11.78 / 战事 +5.79+5.7918 年累积偏离,与 ITS 同源以为两方法独立证据同源数据下高度共线,但仍互相验证
D2 / D8 不显著内省维度无 1853 触发以为创湘军会改人格v2 数据修正 v1 小样本错觉
Placebo 未跑当前仅点估计以为不严谨方向一致已是初步验证,第 7 章补全