颗粒度和因果中介:用模型思考

正确的决策要求你对事物有正确的认识。咱们先从一个错误的认识说起。
网上流传一种市侩哲学:“如果想不得癌,……就一定要放开,内心要强大到混蛋……你别憋着……不要自己心里太拧巴,这是减少癌症发生的方法!”
很多人相信癌症是“气出来的”,但我不得不说,那是伪科学。
美国癌症协会(American Cancer Society, ACS)专门有个科普页面 [1],直接说研究显示人的个性、想法和情绪既不会导致癌症,也不会影响癌症是否复发。美国国家癌症研究所(NCI)说得更保守一点 [2],说压力和癌症之间“没有清晰链条”。
其实这里早就有一系列大规模跟踪研究。比如一项对超过 10 万英国女性的研究 [3] 发现压力频度和不良生活事件与乳腺癌风险无关。一项针对超过 11 万人的大规模荟萃分析 [4] 显示,在 排除了吸烟、饮酒等因素后,所谓“工作压力”与任何主要癌症的风险都没有关联。更有研究 [5] 发现,愤怒控制、负面情绪与癌症风险总体无显著关联。
那你说不对啊,《精英日课》专栏不是经常讲压力对健康的各种坏处吗?怎么压力偏偏不会导致癌症呢?
科学家对此说得很明白。那些研究说的是压力不会直接导致癌症 —— 但压力可能与癌症有间接的关系。比如说,压力可能会让你产生不健康的生活习惯,比如吸烟、喝酒、暴饮暴食,而这 些习惯有可能增加癌症的风险。
这是两个非常不同的故事。理解这两个故事的区别,你才能学会控制复杂事物。
简单说,要想操控一个事物,你必须在头脑中建立这个事物的「模型」。
✵
咱们先看看没有模型是什么状况。想象一个大学宿舍楼的管理员,他最反感每天晚上过了熄灯时间楼里还有吵闹声。如果对宿舍楼的情况一无所知,他就只能一听见吵闹声就出去大喊大叫让大 家不要吵了,甚至不得不挨个屋子敲门。
可是如果宿管员脑子里有个宿舍楼的模型,他知道比如说 305 房间有个低音炮、117 房间有个学生最爱在熄灯以后打联网对战游戏、这几天二楼的水泵坏了大家洗漱慢……他就不必无能狂怒,而能够根据噪音的类型精准干预。
其实生活中很多人就像是那个宿管员,体检指标差了就喝枸杞,一看项目延期就要求员工加班,听说孩子成绩下滑就疯狂打骂……你都不知道事情是怎么回事儿,但是你必须做点大动作。
模型,是事物在你头脑中的一个结构镜像,能帮你看清楚它运行的底层机制。没有模型,你就如同面对黑箱,只能对输入信号做冲动的反应;有了模型,你才知道按钮在哪儿。
控制论领域有个极其深刻的说法,叫「好调节器定理(Good Regulator Theorem)」,是 1970 年由罗杰·科南特(Roger C. Conant)和 W·罗斯·阿什比(W. Ross Ashby)提出来的 [6],意思非常简单:
「系统的每一个好调节器,都必须是该系统的一个模型。」
这个定理等于是从数学上证明了,你的认知结构必须同构于你想要控制的那个事物。如果你的模型比现实世界简单太多 —— 比如用“癌症是气出来的”解释复杂的生物学 —— 你就一定会丢失关键 信息,你的决策就一定是错的。
说白了,你能理解到什么程度,才能控制到什么程度。
那好的模型该是什么样呢?我们至少有两个要求。
✵
第一个要求是模型的复杂度 —— 也就是职场白领爱说的「颗粒度(Granularity)」 —— 必须恰到好处。太简单粗糙固然不好,但是太复杂也不好。说我就像《三体》里的智子一样,要把世界上每个粒子都跟踪起来,那你的算力根本受不了,而且反而会让你把注意力放在没有用的地方。
模型一定是对真实世界的某种压缩,而这个压缩要恰到好处才好。你早就听说过所谓「奥卡姆剃刀(Occam’s razor)」,也就是「如无必要,勿增实体」 —— 信息论里有个理论相当于是把奥卡姆剃刀变成了可计算的准则,叫做「最小描述长度(Minimum Description Length, MDL)」[7]。
简单说,最小描述长度准则要求,最好的模型应该是使得以下两项之和最小的那个模型:
模型的长度:描述这个模型本身所需要的比特数,也就是你这个模型本身有多复杂;
数据补丁的长度:如果别人用你这个模型解释现实,还要补充多少例外说明。
说白了就是最好的模型,是那个能用最短的代码长度,解释最多数据的模型。
比如人家问你本地的天气怎么样。你要是把过去一年每天的天气都给描述一遍,那就太长了,没有压缩谈不上理解,这叫「过拟合」。你要是就回答一句“这地方总下雨”,那就太短了,是「欠 拟合」……
一个恰到好处的描述是:“这里属于温带海洋性气候,受西风带控制,全年温和湿润,虽然阴雨天多,但多是毛毛雨,很少有暴雨。”才几十个字,有规律、有机制、能代表很多数据,别人一听 就知道是怎么回事,这就是好模型。
用模型思考,要善于丢掉细节直达本质。有时候与事物保持一定的心理距离,你的解释水平反而更高 [8],因为你更能把问题抽象化、原则化。
为什么最近股市在跌?你要是考察网上舆论能列举出来 100 个理由:中央银行加息、地缘政治、某公司财报、某大V的言论……堆一大堆噪音还是一脸困惑。高手的模型一定是高压缩的:“流动性收紧导致风险资产重估。”这一句话就能解释 80% 的波动。
有一句格言叫「理解即压缩(Understanding is Compression)」。练成这个功夫,你就是那个传说中所谓“花半秒钟就看透事物本质的人”。
✵
好模型的第二个要求是其中包含因果关系。有因果关系,你才能讲清楚事情的机制。
咱们这里不谈哲学 —— 要是从纯粹哲学角度讲,这个世界上有没有真正的因果关系还两说。我们使用图灵奖得主朱迪亚·珀尔(Judea Pearl)在《为什么:关于因果关系的新科学》(The Book of Why)[9] 一书里那个洞见:我们不是想要彻底说清楚绝对的因果,我们其实想知道的是:我做什么事儿能*干预(intervene)*这件事的发生。
经常一起发生的两件事之间未必有因果关系,可能只是相关性。但是,如果我是强行介入(珀尔的术语叫 do-operator),在保持其他所有因素不变的情况下单方面让事件 X 发生,而这时候事件 Y 发生的概率增加了,那么我就可以说 X 对 Y 有因果效应,或者说 X 至少是导致 Y 的一个原因,标记为 X → Y。
比如说,公鸡每天早上一打鸣,太阳就出来,这是一个相关性。要知道这里有没有因果,你必须做一个干预:有一天你强行介入,把公鸡的嘴堵上,看看太阳还会不会出来。如果太阳照样升起 ,那就说明公鸡打鸣和太阳出来之间没有因果关系。
反过来,你走进一个黑暗的房间,完全出于自由意志单方面突然行动,按一个开关,灯就亮了,那我们就可以说这里有因果关系:开关 → 灯亮。
你的模型中应该包含若干个因果关系,最好把各个变量用因果关系箭头串联起来画成图,清晰展示整个事情的机制。
✵
现在关键的洞见来了:任何模型都不可能穷尽一个事物中所有的因果关系,多了也不好少了也不好,达到最小描述长度才好。
比如我们前面说了,大量的研究都指出生气和癌症之间的相关性是很小的:很多人经常生气也不得癌症,很多人不生气却得了癌症……但你要是强行找相关性,的确也有一些研究显示,生气的人 比不生气的人,患癌概率要稍微高那么一点点。可如果你据此就说“生气 → 癌症”,那就太不负责任了。
这个链条过于粗糙而且效应太脆弱。负责任的做法是看看这里面还有没有间接效应,也就是所谓「中介变量(Mediator)」:生气导致了什么,然后那个什么又导致了癌症?
美国国家癌症研究所直接点名 [2],长期心理压力可能让人更容易有不良生活习惯,包括暴饮暴食、不运动、吸烟、酗酒,而这些,才是更明确的癌症风险因素。所以更精确的因果链条是
生气 → 不良生活习惯 → 癌症
那些研究说,如果排除这些不良生活习惯的影响,生气和癌症之间就没有什么关系。
找到“不良生活习惯”这个中介,事情就好操作了:如果你虽然情绪不佳,但依然能坚持锻炼并控制饮食,那么你就不会因为“生气”而得癌症。
有个好模型,你才能抓住控制点。
✵
咱们看一个经典案例,出自迈克尔·刘易斯(Michael Lewis)的《点球成金》(Moneyball)一书 [10]。
棒球这个运动在美国已经流行了很多很多年,但是长期以来,棒球人的“模型”是非常粗糙的。球探认为球星 → 赢球:得买那些能打出全垒打、长得帅、姿势优美的球员……而这就使得符合那个形象的球员极其昂贵。
大约是 2002 年,奥克兰运动家队总经理比利·比恩(Billy Beane)因为没钱,被迫领悟到了一个新的棒球模型:赢球需要得分,而得分需要上垒!
(击球 + 选球眼光) → 上垒 → 得分 → 赢球
上垒是被人忽视的关键中介变量:不管你是打出去的、跑出去的,还是被球砸中身体保送的,只要你能上垒,你就能制造得分机会 —— 而市场上,那些“长得丑、姿势怪、不会打全垒打但特别能蹭上垒”的球员,价格像白菜一样便宜。
于是比恩买了这样一群被传统球探鄙视的球员……结果是以极低的薪资总额创下了 20 连胜的纪录。
很多人说这是“大数据”的胜利 —— 可什么叫大数据?没有模型哪知道怎么分析数据?这是因果模型对直觉的降维打击。
好,现在我们把《点球成金》这个思维用在足球上,你猜一猜,足球比赛中的“上垒”是什么?你可能想到“助攻”,也就是进球之前的最后一脚传球。但这个模型太简单了,解说员和球迷早就知 道助攻的价值,助攻都有自己的排行榜……那里没有溢价。
现代足球专家使用的模型是,真正的杀招往往不是射门也不是最后一脚传球 —— 而是倒数第二脚、第三脚传球或者带球突破:是那个撕开防线,改变了场上的概率结构的动作 [11]。
本来攻守双方是平衡的,人群之中有个球员看似随意地传了一脚球,把球从低威胁区域送到了高威胁区域,进球概率一下子就从 2% 提升到了 30%。模型说,这一脚提高了「期望威胁(Expected Threat)」。
别盯终点,盯中介。
✵
咱们来几个小应用案例,帮你找找手感。
比如说买手机。有的人说“我就要苹果新出的最贵的那款”,或者“我买个便宜的就行”,这都是过短的模型。也有人花好几天研究各种手机参数,又是比价又是看评测,最后还没买成,那你用的 模型就太长了。
最小描述长度准则要求信息刚好够用。你先想好买手机干什么:你是只需随便拍个娃,还是经常要拍夜景?你是要打游戏,还是只看看短视频?只考虑几个关键变量,把模型压缩到最简,才能 准确决策。
再比如学习。孩子成绩不好家长就大喊大叫,说你怎么不努力。可是学习有很多环节,到底哪个环节出了问题?你得有模型才能分析。我们搞个最简单的模型:
(时间 + 注意力)→ 记忆编码 → 提取 → 成绩
如果是时间和注意力投入不足,那的确是孩子不努力;如果是记忆编码有问题,那就是老师没教好或者学习材料不对;如果是提取问题,那就是练习不充分。有些家长只知道盯着孩子学习时间 ,那是因为他们只能看懂时间。
还有公司管理。有些老板喜欢搞长模型,各种场景事无巨细都有详细规定,员工根本执行不了。有些老板喜欢短模型,甚至说我只要结果,你们看着办……
好的管理,应该首先设定几条核心价值观,尽量覆盖复杂场景;然后要对公司的核心业务建立因果关系:如果终点是收入,那么中介可能是留存、转化率、渠道质量、产品体验、交付速度;再 往前还有团队协作、决策效率、信息流等等。
只盯收入,你就会专门做短期促销,属于欠拟合;要是对以上所有中介变量全都盯住每天做日报,你就无所适从,陷入过拟合。
最小描述长度准则要求你找到一两个最关键中介进行干预,那些才是上垒和威胁传球。
✵
高水平决策者知道自己该看什么。他会以最小描述长度,把事情压缩成一个模型。他会洞察其中的机制,描绘因果关系图,确保自己发现关键中介。
其实没有绝对标准的颗粒度。到底模型要细致到什么程度才好,是由你的主观需求决定。而且你到现场总会遭遇意外。
有句格言说:「地图不是疆域。」(The map is not the territory.)把世界变成模型总是有危险的,但如果你连地图都没有,你连路都上不了。
注释
[1] American Cancer Society. “Do Feelings and Attitudes Have an Effect on Cancer?” Updated November 21, 2025. https://www.cancer.org/cancer/coping/attitudes-feelings-and-cancer.htm
[2] National Cancer Institute. “Stress and Cancer.” https://www.cancer.gov/about-cancer/coping/feelings/stress-fact-sheet
[3] Schoemaker, Minouk J., et al. “Psychological stress, adverse life events and breast cancer incidence: a cohort investigation in 106,000 women in the United Kingdom.” Breast Cancer Research 18, no. 1 (2016): 72.
[4] Heikkilä, Katriina, Solja T. Nyberg, Tores Theorell, Eleonor I. Fransson, Lars Alfredsson, Jakob B. Bjorner, Marianne Borritz, et al. “Job Strain and the Incidence of Cancer: An Individual-Participant Meta-Analysis of 116,000 European Men and Women.” BMJ (British Medical Journal) 346 (2013): f165.
[5] White, V. M., et al. “Is Cancer Risk Associated with Anger Control and Negative Affect? Findings from a Prospective Cohort Study.” Psychosomatic Medicine 69, no. 7 (2007): 667–674.
[6] Conant, Roger C., and W. Ross Ashby. “Every Good Regulator of a System Must Be a Model of That System.” International Journal of Systems Science 1, no. 2 (1970): 89–97.
[7] Grünwald, Peter D. The Minimum Description Length Principle. Cambridge, MA: MIT Press, 2007.
[8] Trope, Yaacov, and Nira Liberman. “Construal-Level Theory of Psychological Distance.” Psychological Review 117, no. 2 (2010): 440–463.
[9] Pearl, Judea, and Dana Mackenzie. The Book of Why: The New Science of Cause and Effect. New York: Basic Books, 2018. 另外,《精英日课》专栏专门解读过《为什么》这本书:洞见因果的三种思维
[10] Lewis, Michael. Moneyball: The Art of Winning an Unfair Game. New York: W. W. Norton, 2003.
[11] Singh K., Introducing Expected Threat (xT): Modelling team behaviour in possession to gain a deeper understanding of buildup play [Blog post]. 2018-12-24. https://karun.in/blog/expected-threat.html