本章目录
本章目录
把阳明全集按 6 种体裁切分:奏疏、公移、文录、续编、语录、外集。在每个体裁上独立算 8 个人格维度的平均分,看跨体裁人格画像差异有多大,同一个人在不同场景里是否表现出截然不同的特质。用体裁固定效应回归把”体裁混淆”与”时间效应”分离,守住因果推断的鲁棒性。
第 1 章的 ITS 把整个全集当作单一数据源,估出 1506 廷杖后 7 维人格重组。但全集里有 6 种体裁:给皇帝的奏疏、行政公移、正式散文文录、私人书信续编、教学语录、诗赋外集。这些体裁的语言风格本身就不同:奏疏有官式套语,诗有抒情语汇,行政公文有命令语气。如果 pre-period 与 post-period 的体裁分布失衡,跨时段的人格分差异就部分由体裁本身解释,不是阳明真的变了。
这一章正面处理这个问题。我们先看 8 个维度在 6 个体裁上的差异有多大,然后用体裁固定效应回归把”体裁”与”时段”的效应分开。
5.1 六体裁的人格画像差异
5.1.1 8 维度按体裁的均值表
把 8 个维度评分应用到全集 1283 文档,按体裁聚合,算各体裁的平均分。结果列在下表。
| 体裁 | 教学耐心 | 反权威 | 自我修正 | 同理心 | 实践导向 | 处变能力 | 决断力 | 情感深度 |
|---|---|---|---|---|---|---|---|---|
| 奏疏 | 4.47 | −0.70 | 0.21 | 0.06 | 0.10 | −0.00 | 0.65 | 2.74 |
| 公移 | 5.81 | −0.03 | 0.19 | 0.43 | 0.11 | −0.01 | 3.33 | 1.46 |
| 文录 | 9.03 | −0.45 | 0.63 | 1.10 | 1.16 | 0.93 | 0.54 | 7.44 |
| 续编 | 6.43 | 0.01 | 0.28 | 0.94 | 0.11 | 0.06 | 1.45 | 6.15 |
| 语录 | 9.17 | 0.70 | 0.69 | 0.47 | 3.13 | 0.09 | 1.33 | 6.77 |
| 外集 | 3.99 | 0.14 | 0.52 | 0.31 | 0.06 | 0.08 | 0.10 | 7.73 |
5.1.2 每个维度的极值体裁与其语言学解释
把这张表的极值排一下:
- 奏疏 vs 语录的反权威:奏疏 −0.70(最谦卑),语录 +0.70(最反权威),跨度 1.40。同一个阳明给皇帝写报告时用”愚以为""鄙人""未敢”,跟学生讲学时用”非也""差矣""吾以为”。
- 公移的决断力:公移 3.33 远超其他体裁。公移是行政指令,“速行""毋得""即令”等命令词高度集中,这是”行政官阳明”的语气。
- 文录的处变能力:文录 0.93 是唯一显著正值。文录是正式散文,官式镇定语汇”臣闻""切详""据查”最多。
- 外集的情感深度:外集 7.73 是最高值。外集是诗赋,“喜怒哀乐念忆叹”等情感词密度自然最大。
- 语录的实践导向:语录 3.13 是其他体裁的 10 倍以上。传习录里”用功""工夫""下手""事上磨”的密度是教学语境特有的。
这张表说明阳明的人格在文本上呈现为六个场景化的画像,而非单一固定向量。同一个人,写给皇帝时是”卑微的官员”,写给学生时是”高敏的导师”,写公文时是”果断的行政官”,写诗时是”情感丰富的诗人”。这是任何成熟个体在不同社会角色下的正常表现,不构成分裂人格。
这件事对现代读者也有意义:你的”人格”是被场景调动出来的不同侧面,而非一个固定的标签。朋友圈里的你 + 工作场合的你 + 私下与父母的你 + 写日记的你,几乎是四个不同的人,这是正常社会化的结果。
5.2 体裁差异对 ITS 推断的威胁
5.2.1 pre/post 体裁失衡的具体机制
回到第 1 章:1506 ITS 估出 7 维重组。pre-period(1496–1505)主要是奏疏体裁(因为这阶段阳明在朝廷任职,写的多是奏疏)。post-period(1507–1528)体裁混杂,包含文录、外集、续编、语录等。体裁切换是 pre/post 的混杂因素。
5.2.2 以”处变能力”为例的混淆路径
“处变能力”维度上能直接看到这条路径。奏疏体的”臣闻""切详""据查”是正向标记,密度高(奏疏平均处变能力 ,主要因负向词也很多,但相对其他体裁仍有官式套语贡献)。post-period 体裁切到文录与诗,这些体裁里基本不出现这些官式词,“处变能力”分自然下降。1506 ITS 估出的处变能力 至少部分由这个体裁切换造成。
本章主结论
5.3 体裁固定效应回归:把体裁与时段分开
5.3.1 固定效应回归的方程形式
要把”体裁效应”与”时段效应”分开,标准做法是固定效应回归:
其中 索引文档, 是文档所属时段,奏疏, 公移, … 是文档体裁。系数 在控制了体裁后,仍然表示时段相对基线 T1 的差。
为什么固定效应能”把体裁与时段分开”?回归在估 时,控制了体裁 的均值。这相当于在每个体裁内部分别看时段效应,再加权平均。如果时段效应是真的,在每个体裁内都应该看到;如果是体裁伪相关,体裁内部就看不到时段效应了。
5.3.2 回归在 5 个维度上的实施
我们在 5 个原始维度(教学耐心、反权威、自我修正、同理心、实践导向)上跑这个回归,看时段系数在加体裁固定效应前后的变化。
5.3.3 识别问题:时段与体裁的近完美共线
这一步遇到一个真实障碍。在 343 条传习录数据上,时段与记录者(或体裁)高度共线:
- T1 徐爱期 = 100% 徐爱
- T2 陆澄期 = 100% 陆澄
- T3 薛侃期 = 100% 薛侃
- T4 卷中书信期 = 卷中各书信对象组合,100% 书信体
- T5/T6 = 学生记录者组合
也就是说,知道一个文档是 T1 几乎等同于知道它是徐爱写的。加体裁(或记录者)固定效应,等于试图从同一个变量里挤出两个独立维度,数学上不可能。
回归会跑出来,但标准误会爆炸到几万的量级。系数估计在数学意义上无意义。这是”近完美共线”(near-perfect collinearity)的标准现象。
5.4 加全集后的部分缓解
5.4.1 扩到全集的识别空间
把语料从 343 条传习录扩到全集 1283 文档后,共线问题部分缓解:T4 不再 100% 是书信体,全集 1518–1527 这段还有文录、续编、外集分布在内。这让回归能部分识别出时段效应在体裁内部的余项。
5.4.2 绝对值缩水但方向稳定
我们在全集级别重做 5 维度的固定效应回归。结果可分三个层面。
- 绝对值显著缩小但方向一致。加体裁 FE 后,时段系数的绝对值通常缩到原来的 40% 到 60%。这说明原始时段效应里确实有相当比例由体裁混淆造成。
- 方向一致性是关键。缩小后的系数仍然指向同一方向:T4 反权威仍负,T6 同理心仍上升,T3 实践导向仍峰值。方向一致说明时段效应是真的,只是绝对值被体裁混淆放大了。
5.4.3 对原始 ITS 估计的保守重读
保守的解读:第 1 章报告的 ITS 效应应当视为”时段 + 体裁”的联合效应的上界估计。真正归因到人格变化的部分约为原始估计的一半。
下图把 5 个维度的原始 ITS 系数与加体裁固定效应后的系数并排画出,直观显示”绝对值缩小但方向一致”的模式。
5.5 方法卡
5.6 本章知识地图
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 跨体裁人格画像 | 同一个人在不同体裁里得分截然不同 | 人格是固定向量 | 人格是场景化的,任何成熟个体在不同社会角色下都有不同表现 |
| 体裁混淆 | 体裁差异被误识别为时段/人格差异 | 加更多变量就能解决 | 当时段与体裁近共线时,加变量也无法分离,这是数据结构限制 |
| 固定效应回归 | 控制体裁均值后看时段净效应 | FE 总能识别真效应 | 共线时 FE 标准误暴涨,系数估计无意义 |
| 近完美共线 | 时段与体裁高度对应 | 只要 N 大就能识别 | 共线是数据结构问题,N 大也无济于事 |
| 方向一致性 | 加 FE 后系数缩小但方向不变 | 方向变化才有意义 | 共线下绝对值不可信但方向相对稳定,方向一致是支持证据 |