颗粒度和因果中介：用模型思考

正确的决策要求你对事物有正确的认识。咱们先从一个错误的认识说起。

网上流传一种市侩哲学：“如果想不得癌，……就一定要放开，内心要强大到混蛋……你别憋着……不要自己心里太拧巴，这是减少癌症发生的方法！”

很多人相信癌症是“气出来的”，但我不得不说，那是伪科学。

美国癌症协会（American Cancer Society, ACS）专门有个科普页面 [1]，直接说研究显示人的个性、想法和情绪既不会导致癌症，也不会影响癌症是否复发。美国国家癌症研究所（NCI）说得更保守一点 [2]，说压力和癌症之间“没有清晰链条”。

其实这里早就有一系列大规模跟踪研究。比如一项对超过 10 万英国女性的研究 [3] 发现压力频度和不良生活事件与乳腺癌风险无关。一项针对超过 11 万人的大规模荟萃分析 [4] 显示，在排除了吸烟、饮酒等因素后，所谓“工作压力”与任何主要癌症的风险都没有关联。更有研究 [5] 发现，愤怒控制、负面情绪与癌症风险总体无显著关联。

那你说不对啊，《精英日课》专栏不是经常讲压力对健康的各种坏处吗？怎么压力偏偏不会导致癌症呢？

科学家对此说得很明白。那些研究说的是压力不会直接导致癌症 —— 但压力可能与癌症有间接的关系。比如说，压力可能会让你产生不健康的生活习惯，比如吸烟、喝酒、暴饮暴食，而这些习惯有可能增加癌症的风险。

这是两个非常不同的故事。理解这两个故事的区别，你才能学会控制复杂事物。

简单说，要想操控一个事物，你必须在头脑中建立这个事物的「模型」。

✵

咱们先看看没有模型是什么状况。想象一个大学宿舍楼的管理员，他最反感每天晚上过了熄灯时间楼里还有吵闹声。如果对宿舍楼的情况一无所知，他就只能一听见吵闹声就出去大喊大叫让大家不要吵了，甚至不得不挨个屋子敲门。

可是如果宿管员脑子里有个宿舍楼的模型，他知道比如说 305 房间有个低音炮、117 房间有个学生最爱在熄灯以后打联网对战游戏、这几天二楼的水泵坏了大家洗漱慢……他就不必无能狂怒，而能够根据噪音的类型精准干预。

其实生活中很多人就像是那个宿管员，体检指标差了就喝枸杞，一看项目延期就要求员工加班，听说孩子成绩下滑就疯狂打骂……你都不知道事情是怎么回事儿，但是你必须做点大动作。

模型，是事物在你头脑中的一个结构镜像，能帮你看清楚它运行的底层机制。没有模型，你就如同面对黑箱，只能对输入信号做冲动的反应；有了模型，你才知道按钮在哪儿。

控制论领域有个极其深刻的说法，叫「好调节器定理（Good Regulator Theorem）」，是 1970 年由罗杰·科南特（Roger C. Conant）和 W·罗斯·阿什比（W. Ross Ashby）提出来的 [6]，意思非常简单：

「系统的每一个好调节器，都必须是该系统的一个模型。」

这个定理等于是从数学上证明了，你的认知结构必须同构于你想要控制的那个事物。如果你的模型比现实世界简单太多 —— 比如用“癌症是气出来的”解释复杂的生物学 —— 你就一定会丢失关键信息，你的决策就一定是错的。

说白了，你能理解到什么程度，才能控制到什么程度。

那好的模型该是什么样呢？我们至少有两个要求。

✵

第一个要求是模型的复杂度 —— 也就是职场白领爱说的「颗粒度（Granularity）」 —— 必须恰到好处。太简单粗糙固然不好，但是太复杂也不好。说我就像《三体》里的智子一样，要把世界上每个粒子都跟踪起来，那你的算力根本受不了，而且反而会让你把注意力放在没有用的地方。

模型一定是对真实世界的某种压缩，而这个压缩要恰到好处才好。你早就听说过所谓「奥卡姆剃刀（Occam’s razor）」，也就是「如无必要，勿增实体」 —— 信息论里有个理论相当于是把奥卡姆剃刀变成了可计算的准则，叫做「最小描述长度（Minimum Description Length, MDL）」[7]。

简单说，最小描述长度准则要求，最好的模型应该是使得以下两项之和最小的那个模型：

模型的长度：描述这个模型本身所需要的比特数，也就是你这个模型本身有多复杂；
数据补丁的长度：如果别人用你这个模型解释现实，还要补充多少例外说明。

说白了就是最好的模型，是那个能用最短的代码长度，解释最多数据的模型。

比如人家问你本地的天气怎么样。你要是把过去一年每天的天气都给描述一遍，那就太长了，没有压缩谈不上理解，这叫「过拟合」。你要是就回答一句“这地方总下雨”，那就太短了，是「欠拟合」……

一个恰到好处的描述是：“这里属于温带海洋性气候，受西风带控制，全年温和湿润，虽然阴雨天多，但多是毛毛雨，很少有暴雨。”才几十个字，有规律、有机制、能代表很多数据，别人一听就知道是怎么回事，这就是好模型。

用模型思考，要善于丢掉细节直达本质。有时候与事物保持一定的心理距离，你的解释水平反而更高 [8]，因为你更能把问题抽象化、原则化。

为什么最近股市在跌？你要是考察网上舆论能列举出来 100 个理由：中央银行加息、地缘政治、某公司财报、某大V的言论……堆一大堆噪音还是一脸困惑。高手的模型一定是高压缩的：“流动性收紧导致风险资产重估。”这一句话就能解释 80% 的波动。

有一句格言叫「理解即压缩（Understanding is Compression）」。练成这个功夫，你就是那个传说中所谓“花半秒钟就看透事物本质的人”。

✵

好模型的第二个要求是其中包含因果关系。有因果关系，你才能讲清楚事情的机制。

咱们这里不谈哲学 —— 要是从纯粹哲学角度讲，这个世界上有没有真正的因果关系还两说。我们使用图灵奖得主朱迪亚·珀尔（Judea Pearl）在《为什么：关于因果关系的新科学》（The Book of Why）[9] 一书里那个洞见：我们不是想要彻底说清楚绝对的因果，我们其实想知道的是：我做什么事儿能*干预（intervene）*这件事的发生。

经常一起发生的两件事之间未必有因果关系，可能只是相关性。但是，如果我是强行介入（珀尔的术语叫 do-operator），在保持其他所有因素不变的情况下单方面让事件 X 发生，而这时候事件 Y 发生的概率增加了，那么我就可以说 X 对 Y 有因果效应，或者说 X 至少是导致 Y 的一个原因，标记为 X → Y。

比如说，公鸡每天早上一打鸣，太阳就出来，这是一个相关性。要知道这里有没有因果，你必须做一个干预：有一天你强行介入，把公鸡的嘴堵上，看看太阳还会不会出来。如果太阳照样升起，那就说明公鸡打鸣和太阳出来之间没有因果关系。

反过来，你走进一个黑暗的房间，完全出于自由意志单方面突然行动，按一个开关，灯就亮了，那我们就可以说这里有因果关系：开关 → 灯亮。

你的模型中应该包含若干个因果关系，最好把各个变量用因果关系箭头串联起来画成图，清晰展示整个事情的机制。

✵

现在关键的洞见来了：任何模型都不可能穷尽一个事物中所有的因果关系，多了也不好少了也不好，达到最小描述长度才好。

比如我们前面说了，大量的研究都指出生气和癌症之间的相关性是很小的：很多人经常生气也不得癌症，很多人不生气却得了癌症……但你要是强行找相关性，的确也有一些研究显示，生气的人比不生气的人，患癌概率要稍微高那么一点点。可如果你据此就说“生气 → 癌症”，那就太不负责任了。

这个链条过于粗糙而且效应太脆弱。负责任的做法是看看这里面还有没有间接效应，也就是所谓「中介变量（Mediator）」：生气导致了什么，然后那个什么又导致了癌症？

美国国家癌症研究所直接点名 [2]，长期心理压力可能让人更容易有不良生活习惯，包括暴饮暴食、不运动、吸烟、酗酒，而这些，才是更明确的癌症风险因素。所以更精确的因果链条是

生气 → 不良生活习惯 → 癌症

那些研究说，如果排除这些不良生活习惯的影响，生气和癌症之间就没有什么关系。

找到“不良生活习惯”这个中介，事情就好操作了：如果你虽然情绪不佳，但依然能坚持锻炼并控制饮食，那么你就不会因为“生气”而得癌症。

有个好模型，你才能抓住控制点。

✵

咱们看一个经典案例，出自迈克尔·刘易斯（Michael Lewis）的《点球成金》（Moneyball）一书 [10]。

棒球这个运动在美国已经流行了很多很多年，但是长期以来，棒球人的“模型”是非常粗糙的。球探认为球星 → 赢球：得买那些能打出全垒打、长得帅、姿势优美的球员……而这就使得符合那个形象的球员极其昂贵。

大约是 2002 年，奥克兰运动家队总经理比利·比恩（Billy Beane）因为没钱，被迫领悟到了一个新的棒球模型：赢球需要得分，而得分需要上垒！

（击球 + 选球眼光） → 上垒 → 得分 → 赢球

上垒是被人忽视的关键中介变量：不管你是打出去的、跑出去的，还是被球砸中身体保送的，只要你能上垒，你就能制造得分机会 —— 而市场上，那些“长得丑、姿势怪、不会打全垒打但特别能蹭上垒”的球员，价格像白菜一样便宜。

于是比恩买了这样一群被传统球探鄙视的球员……结果是以极低的薪资总额创下了 20 连胜的纪录。

很多人说这是“大数据”的胜利 —— 可什么叫大数据？没有模型哪知道怎么分析数据？这是因果模型对直觉的降维打击。

好，现在我们把《点球成金》这个思维用在足球上，你猜一猜，足球比赛中的“上垒”是什么？你可能想到“助攻”，也就是进球之前的最后一脚传球。但这个模型太简单了，解说员和球迷早就知道助攻的价值，助攻都有自己的排行榜……那里没有溢价。

现代足球专家使用的模型是，真正的杀招往往不是射门也不是最后一脚传球 —— 而是倒数第二脚、第三脚传球或者带球突破：是那个撕开防线，改变了场上的概率结构的动作 [11]。

本来攻守双方是平衡的，人群之中有个球员看似随意地传了一脚球，把球从低威胁区域送到了高威胁区域，进球概率一下子就从 2% 提升到了 30%。模型说，这一脚提高了「期望威胁（Expected Threat）」。

别盯终点，盯中介。

✵

咱们来几个小应用案例，帮你找找手感。

比如说买手机。有的人说“我就要苹果新出的最贵的那款”，或者“我买个便宜的就行”，这都是过短的模型。也有人花好几天研究各种手机参数，又是比价又是看评测，最后还没买成，那你用的模型就太长了。

最小描述长度准则要求信息刚好够用。你先想好买手机干什么：你是只需随便拍个娃，还是经常要拍夜景？你是要打游戏，还是只看看短视频？只考虑几个关键变量，把模型压缩到最简，才能准确决策。

再比如学习。孩子成绩不好家长就大喊大叫，说你怎么不努力。可是学习有很多环节，到底哪个环节出了问题？你得有模型才能分析。我们搞个最简单的模型：

（时间 + 注意力）→ 记忆编码 → 提取 → 成绩

如果是时间和注意力投入不足，那的确是孩子不努力；如果是记忆编码有问题，那就是老师没教好或者学习材料不对；如果是提取问题，那就是练习不充分。有些家长只知道盯着孩子学习时间，那是因为他们只能看懂时间。

还有公司管理。有些老板喜欢搞长模型，各种场景事无巨细都有详细规定，员工根本执行不了。有些老板喜欢短模型，甚至说我只要结果，你们看着办……

好的管理，应该首先设定几条核心价值观，尽量覆盖复杂场景；然后要对公司的核心业务建立因果关系：如果终点是收入，那么中介可能是留存、转化率、渠道质量、产品体验、交付速度；再往前还有团队协作、决策效率、信息流等等。

只盯收入，你就会专门做短期促销，属于欠拟合；要是对以上所有中介变量全都盯住每天做日报，你就无所适从，陷入过拟合。

最小描述长度准则要求你找到一两个最关键中介进行干预，那些才是上垒和威胁传球。

✵

高水平决策者知道自己该看什么。他会以最小描述长度，把事情压缩成一个模型。他会洞察其中的机制，描绘因果关系图，确保自己发现关键中介。

其实没有绝对标准的颗粒度。到底模型要细致到什么程度才好，是由你的主观需求决定。而且你到现场总会遭遇意外。

有句格言说：「地图不是疆域。」（The map is not the territory.）把世界变成模型总是有危险的，但如果你连地图都没有，你连路都上不了。

注释

[1] American Cancer Society. “Do Feelings and Attitudes Have an Effect on Cancer?” Updated November 21, 2025. https://www.cancer.org/cancer/coping/attitudes-feelings-and-cancer.htm

[2] National Cancer Institute. “Stress and Cancer.” https://www.cancer.gov/about-cancer/coping/feelings/stress-fact-sheet

[3] Schoemaker, Minouk J., et al. “Psychological stress, adverse life events and breast cancer incidence: a cohort investigation in 106,000 women in the United Kingdom.” Breast Cancer Research 18, no. 1 (2016): 72.

[4] Heikkilä, Katriina, Solja T. Nyberg, Tores Theorell, Eleonor I. Fransson, Lars Alfredsson, Jakob B. Bjorner, Marianne Borritz, et al. “Job Strain and the Incidence of Cancer: An Individual-Participant Meta-Analysis of 116,000 European Men and Women.” BMJ (British Medical Journal) 346 (2013): f165.

[5] White, V. M., et al. “Is Cancer Risk Associated with Anger Control and Negative Affect? Findings from a Prospective Cohort Study.” Psychosomatic Medicine 69, no. 7 (2007): 667–674.

[6] Conant, Roger C., and W. Ross Ashby. “Every Good Regulator of a System Must Be a Model of That System.” International Journal of Systems Science 1, no. 2 (1970): 89–97.

[7] Grünwald, Peter D. The Minimum Description Length Principle. Cambridge, MA: MIT Press, 2007.

[8] Trope, Yaacov, and Nira Liberman. “Construal-Level Theory of Psychological Distance.” Psychological Review 117, no. 2 (2010): 440–463.

[9] Pearl, Judea, and Dana Mackenzie. The Book of Why: The New Science of Cause and Effect. New York: Basic Books, 2018. 另外，《精英日课》专栏专门解读过《为什么》这本书：洞见因果的三种思维

[10] Lewis, Michael. Moneyball: The Art of Winning an Unfair Game. New York: W. W. Norton, 2003.

[11] Singh K., Introducing Expected Threat (xT): Modelling team behaviour in possession to gain a deeper understanding of buildup play [Blog post]. 2018-12-24. https://karun.in/blog/expected-threat.html