第 4 章

跨文体画像:日知录、文集、诗集三体裁差异

把顾炎武三块数据分别在 8 维人格与 9 主题上算均值,揭示日知录、文集、诗集三体裁的画像差异。

本章要回答的

把顾炎武三块数据分别在 8 维人格与 9 主题上算均值;给出日知录(札记体)与文集(论说书启体)与诗集(抒情体)的画像差异;揭示顾炎武在三种社交语境下的人格切片;这是 无编年 数据集的最大价值利用。

第 2 章 ITS 仅用诗集 329 首(中位年聚合 5 时段),留下日知录 878 条 + 文集 613 篇共 119 万字未用。本章用这两块数据 + 诗集做 三体裁画像,不依赖编年,看顾炎武在三种写作语境下的话语差异。

4.1 9 主题在三体裁上的均值

主题日知录(n=878)文集(n=613)诗集(n=329)
经学21.0415.410.00
史学10.937.640.00
易代6.396.060.00
故国0.250.480.00
制度0.190.040.00
兵事5.057.960.00
风俗6.365.620.00
学术5.884.990.00
隐遁3.1010.780.00

日知录与文集呈现出清晰的体裁画像差异。

日知录最强主题:经学 21.04 + 史学 10.93,远高于文集(15.41 / 7.64)。这条印证日知录的 札记本质——顾炎武读经史时随手摘记心得,经学条目最密集(易、诗、书、礼、春秋五经轮转),史学条目次之(考证制度、地理、人物)。

文集最强主题:兵事 7.96 + 隐遁 10.78,反超日知录。兵事高源于文集卷一卷二的政论 军制论 / 形势论 类文章,大量 兵 / 将 / 战 / 守 用词;隐遁高源于文集卷三卷四的书信,顾炎武对友人频繁表达 归 / 退 / 山林 / 辞官 等隐逸语汇。

易代主题在两体裁接近(6.39 vs 6.06):不论札记还是书信,顾炎武对 易代 / 明 / 清 / 亡 / 变 等核心易代词的使用密度都接近。这条同质性说明易代是顾炎武 超越体裁的共同关切,不是某种体裁的局部话题。

4.2 8 维人格维度在三体裁上的均值

维度日知录文集诗集
D1 政治姿态0.630.370.00
D2 自我修正3.322.330.00
D3 实践导向1.751.380.00
D4 处变能力1.561.900.00
D5 决断力7.555.880.00
D6 情感深度2.869.270.00
D7 隐逸倾向2.646.620.00
D8 三教融合9.868.970.00

8 维度差异更明确。

日知录在 D1 / D2 / D3 / D5 / D8 五维度上偏高:札记体集中体现顾炎武 政论 + 自省 + 躬行 + 判断 + 三教融合 五条学术姿态。这与日知录 读书有所得辄记之 的工作方式一致,读什么记什么,学术姿态密集。

文集在 D4 处变能力 + D6 情感深度 + D7 隐逸倾向三维度反超日知录:文集多书信,写给朋友 / 学生时顾炎武用 随遇 / 安然 / 归去 / 思 / 怀 / 忧 等社交情感语汇,这是札记体所没有的 对人语境。D7 隐逸倾向文集 6.62 vs 日知录 2.64 翻 2.5 倍,反映书信中讨论归隐去就的密度远高于札记中。

这条日知录 = 学术姿态密集,文集 = 社交情感密集的清晰分化,与四案例其他体裁对照(家书 vs 奏稿 vs 日记 vs 信札)一致,是”人格因果”学派的稳健发现:同一人在不同体裁里的人格切片差异显著,必须分体裁分析

4.3 诗集编年缺陷的诚实交代

表 4.1 与表 4.2 中诗集列全为 0.00,这不是真实均值,是 code/extract_and_analyze.py 第一版的体裁判断缺陷。第一版把所有诗都误打 genre = "文",没有正确分到 genre = "诗"。第 5 章会用 code/extract_with_period.py 重新抽取的 诗集 329 首 5 时段编年版 数据补全诗集的主题画像。

4.4 两个核心稳健结论

排除诗集编年问题,本章在两个无编年体裁(日知录 + 文集)上得到两条稳健发现。

结论一:体裁差异极大。日知录 8 维度平均(3.79 per1k)比文集(4.59)略低,但 维度上的相对侧重 完全不同。任何顾炎武研究若只用单一体裁(如多数研究只看日知录),都会错过他在书信里展现的 社交情感 人格切片。

结论二:易代主题超越体裁稳定易代 / 故国 / 兵事 三个 1644 之后核心主题在日知录与文集中密度接近(易代 6.4 / 6.1,兵事 5.1 / 8.0)。这条 超越体裁的稳定性 说明易代是顾炎武一生 真正的话语母题,在札记里反复思考,在书信里反复议论。


4.5 本章知识地图

核心概念核心内容常见误解为什么错
日知录 vs 文集学术姿态 vs 社交情感以为两者同质札记体 vs 书信体差异显著
D7 隐逸 6.62 vs 2.64文集书信谈隐逸密集以为日知录隐逸最强书信对友人更频繁讨论归去
易代主题超越体裁6.4 / 6.1 接近以为某体裁专谈易代易代是顾炎武终身话语母题
诗集 0.00 缺陷v1 抽取脚本误判以为诗里无相关词抽取迭代中的中间状态

参考文献