本章目录
本章目录
把曾国藩家书按 3 类收信人切分:父母长辈 76 封、兄弟 1,170 封、儿子 236 封。在每类收信人上独立算 8 个人格维度的平均分,用收信人固定效应回归把”收信人语境混淆”与”时段效应”分离。给出 D5 决断力的 1860 后效应中 52% 由收信人混淆解释这一关键发现。
第 1 章 ITS 把家书合并处理,没区分收信人。但父母长辈(用谦卑语)、兄弟(用劝导语)、儿子(用训诫语)三种语境的语言风格不同,如果 pre / post 收信人分布失衡,跨时段差异部分由收信人本身解释。本章用固定效应回归扣除收信人混淆。
5.1 3 类收信人的人格画像差异
| 维度 | 父母长辈() | 兄弟() | 儿子() |
|---|---|---|---|
| D1 政治姿态 | 0.53 | 0.24 | 0.12 |
| D2 自我修正 | 3.04 | 2.68 | 3.09 |
| D3 实践导向 | 0.63 | 0.73 | 0.92 |
| D4 处变能力 | 0.23 | 0.19 | 0.18 |
| D5 决断力 | 12.27 | 16.23 | 17.68 |
| D6 情感深度 | 5.59 | 4.09 | 3.55 |
| D7 隐逸倾向 | 4.16 | 4.04 | 4.35 |
| D8 三教融合 | 5.36 | 4.99 | 5.33 |
收信人语境差异最大的维度是 D5 决断力,父母 12.27 vs 兄弟 16.23 vs 儿子 17.68,跨度 5.41。
D5 决断力差异反映曾国藩给父母写信时姿态相对谦卑(“男跪禀 / 男谨遵”),决断词密度偏低;给兄弟写信时姿态权威(“汝当 / 须 / 切宜”),决断词密集;给儿子写信时训诫口吻更强(“尔须 / 不可 / 必当”),D5 最高。同一个曾国藩在三种语境里决断词密度差 44%。
D1 政治姿态差异也较大,父母 0.53 vs 儿子 0.12,跨度 0.41(相对值 4 倍)。给父母写信时偶尔讨论朝政(如奏请保父母平安、汇报升迁),给儿子写信几乎不谈朝政,都是修身教化。
D6 情感深度差异父母 5.59 vs 儿子 3.55,父母信里情感词更密,反映对父母的孝思明显于对子女的训诫。
D2 自我修正、D7 隐逸倾向、D8 三教融合在三类收信人上均值接近(差 < 0.5),说明这些维度跨语境稳定,是曾国藩个人风格而非对特定收信人定制。
为什么 D7 隐逸倾向在三类收信人上接近?直觉上给儿子谈归田归隐不太合适,但数据告诉我们曾国藩对父母、兄弟、儿子都频繁谈归 / 老 / 病 / 闲 / 衰。这反映他后期(1860 后)持续上奏请退、对全家都频繁讨论退归故里。隐逸倾向是曾国藩整个晚年的核心话题,不区分收信人。
5.2 收信人 FE 回归:扣除混淆后的 1860 效应
把 1860 安庆围攻作为 treatment,跑 8 维度的 naive 回归与收信人 FE 回归对比。
| 维度 | naive | FE | 差 |
|---|---|---|---|
| D1 政治姿态 | |||
| D2 自我修正 | |||
| D3 实践导向 | |||
| D4 处变能力 | |||
| D5 决断力 | |||
| D6 情感深度 | |||
| D7 隐逸倾向 | |||
| D8 三教融合 |
8 维度中,7 个的 naive 与 FE 系数差异在 以内,说明收信人混淆对它们的影响轻微。
D5 决断力是唯一受收信人混淆显著影响的维度:naive ,FE ,差 。这意味着 1860 后表观上看到的决断力上升约 52% 是由收信人结构变化解释的,真实变化只有 0.74 per1k。
为什么 D5 这么敏感?1860 后曾国藩家书的兄弟占比急剧上升(湘军军务多与沅澄温季商量,父母长辈 1852 母丧、1857 父丧已不在)。兄弟与儿子信里 D5 决断词本来就高(16.23 / 17.68 vs 父母 12.27),post-period 的高 D5 系数完全可以由收信人结构变化解释。扣除收信人 FE 后,真实的 1860 后决断力上升只剩 0.74——仍是正向,但幅度比直观估计弱一半。
D6 情感深度的次大调整:naive ,FE ,差 。28% 的情感下降由收信人解释,同样因为父母长辈(情感词最密)的占比下降。
其他 6 维度方向稳健,收信人 FE 吸收幅度 < 0.1。这条选择性混淆说明:收信人 FE 不需要在所有维度上做,重点检查 D5 / D6 两个对收信人结构最敏感的维度即可。
5.3 代笔诊断:家书 vs 批牍的边界
本书数据集只用家书,不含批牍,因此代笔诊断在数据层面不成为问题。家书几乎全部是曾国藩亲笔,个别书信末尾署命幕僚XX代书或病不能起口授,在 1,482 封中约 5–10 封,占比 < 1%,对 ITS / FE 影响可忽略。完整 ghostwriting 标注留作 iteration。
这条与苏轼项目(1086–1089 翰林期 821 篇内制外制需要严格剔除)形成鲜明对比,反映家书数据集相对文集数据集的天然纯度优势。
5.4 本章知识地图
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 收信人 FE | 把收信人作为固定效应吸收 | 以为家书都同质 | 父母 / 兄弟 / 儿子语境差异极大 |
| D5 决断力 52% 由收信人解释 | naive → FE | 以为 1860 后决断力大幅上升 | 收信人结构变化贡献一半 |
| D6 情感深度 28% 由收信人解释 | naive → FE | 以为情感深度下降很大 | 父母长辈在 1857 后退场 |
| 其他 6 维不受 FE 影响 | 差 | 以为所有维度都该 FE | 选择性混淆,重点查 D5 D6 |
| 曾国藩代笔 < 1% | 家书天然亲笔 | 以为与苏轼项目一样要严格剔除 | 苏轼 821 篇翰林代笔,曾国藩家书几乎无 |