参考类:当局者迷,旁观者清,你不特殊

Table of Contents
一个高中生每天刷题到深夜,常被自己流下的汗水感动。父母都说他一定行,他也认定只要这么拼命,就一定能考上清华。
一个都市女性坚信自己只要不将就,一定能等到那位身披金甲圣衣脚踏七彩祥云非她不娶的盖世英雄。
一个创业者刚刚想出了一个产品雏形,就已经在脑子里把用户增长曲线画成了火箭。
这些都是非常可爱的人。他们身上有一种真诚的英雄主义,他们是生活的主角,世界因为他们而精彩。但是他们都活在梦中。
我们说了,这个宇宙的第一性原理是叙事。人需要叙事给自己意义。我们都最好有一点热情,有一点想象,甚至有一点自我感动。可你要想科学计划,对未来做出靠谱预测,最有效的指导可不是你梦中的叙事,而是同类人、同类事已经发生过的经验。
这一讲的思维工具叫「参考类预测(Reference Class Forecasting, 简称 RCF)」。它本是一个预测算法,但在我看来,它更像是一个“反自恋装置”。如果你认为“我很特殊”、“我这次一定不一样”,你最好先用一下这个工具。
✵
梦想与现实的鸿沟 #

关于梦想和现实的差距,有个现成的规律,叫「规划谬误(Planning Fallacy)」。
心理学家罗杰·比勒(Roger Buehler)等人的一个研究是这样的 [1]。让一群学生估算他们各自完成毕业论文还需要多少天,学生们平均给出的预期是 33.9 天。比勒说不行,你们太乐观了,你们来一个最悲观的估计!这回平均是 48.6 天。
你猜他们实际上用了多少天?55.5 天。
规划谬误说的就是人一做计划,就会系统性地低估时间、成本和风险,同时还高估收益。现实往往比你最悲观的估计还要悲观。
那你说是不是只有普通人这样,要是做正规大项目人们就会准确估计呢?不是。我们前面提到过的丹麦经济学家傅以斌(Bent Flyvbjerg)是大型项目专家,他跟合作者研究了 258 个交通基础设施项目,发现普遍存在延期和成本超支 —— 其中铁路项目平均超支 45%,桥梁与隧道 34%,公路 20% [2]。傅以斌专门写了本书谈论大项目规划失败问题 [3],其中最著名的例子是悉尼歌剧院:原本预算 700 万美元,计划 4 年完工,结果花到 1.02 亿美元,14 年才完工。
规划谬误是「一厢情愿」这个成语的现代版,它是大脑里一系列幻觉生成器共同造就的 ——
- 「乐观偏差(Optimism Bias)」告诉你“这次一定顺”
- 「确认偏误(Confirmation Bias)」让你只搜集利好证据
- 「控制错觉(Illusion of Control)」让你以为世界井井有条、意外情况都在掌控之中
- 「自利归因(Self-Serving Attribution)」让你把上次翻车怪到天气、队友和甲方头上
- 「幸存者偏差(Survivor Bias)」和「可得性偏差(Availability Bias)」让你只看见成功故事而看不见沉在水底的尸体……最后「叙事谬误(Narrative Fallacy)」则负责把这些碎片拼成一部热血电影。
你脑子里排练的是剧本,而不是真实世界。
而你之所以用剧本思考,是因为你使用的是「内部视角(inside view)」。你自己看自己,就只知道盯着这一件事的细节、你的努力、你的诚意、你的资源配置 —— 你心想这还能有啥问题?
当局者迷旁观者清,你需要外部视角。
✵
内部视角与外部视角 #

「外部视角(Outside View)」和参考类预测都起源于卡尼曼 [4],后来则是由傅以斌把参考类预测从心理学推广到了工程实践 [5]。
简单说,内部视角看的是你的个案信息(singular information),而外部视角看的则是分布信息(distributional information):在别人眼里,你只是一个受制于客观规律的统计学数据点,你并不特殊。
外部观察者关心的是跟你条件差不多的同类事情 —— 也就是你的「参考类(Reference Class)」 —— 的分布:平均水平如何、中位数是什么、尾部风险是怎样、失败率是多少,并且以这些统计数据来推测你会如何。
内部视角盯住本项目,外部视角先看同类项目,这就是「当局者迷,旁观者清」的现代认知科学版本。旁观者未必比你聪明,但旁观者的好处是没有你那么多自恋情结:人家把你当成样本,而不是当主角。
这里有个最经典的故事,来自卡尼曼本人,收录在《思考,快与慢》一书中。
1970 年代,卡尼曼带队编写一本给高中生的决策学教材。团队第一次开会,卡尼曼问,我们多长时间能把这本书编完?大家群情激昂,信誓旦旦地说:两年!最多两年就能搞定!但卡尼曼留了个心眼,转头问团队里一位教育专家:“你认识的、跟我们条件差不多的团队,编这样一本书通常要几年?”
专家说大概 7 到 10 年,而且有 40% 的团队最后干脆放弃了。
卡尼曼很震惊,但他想我们团队肯定不至于,我们效率更高。
……结果卡尼曼团队花了整整 8 年才把书搞出来。而那时候教育部已经取消了这门课的教学需求。
你以为你们不一样,其实每个人都觉得自己不一样。现实是,在统计学意义上大家都一样。
✵
参考类预测的三步法 #

傅以斌把参考类预测标准化成了三个步骤 [6]:
- 第一步: 找一个数量足够多的、包含和你类似的项目的「参考类」 —— 不是你喜欢的榜样,而是找一组和你足够相似、而且已经结束的案例;
- 第二步: 看看这个参考类的分布,找到它的基准线,包括平均成本、时间、失败率等等;
- 第三步: 把你自己的项目放进去对比,根据客观情况做微调:我更像是中位数,还是应该更保守一点?
第三步是最考验人的一步。其实最简单的办法就是直接用参考类里的中位数来预测自己。傅以斌再三强调,如果你非要说你跟别人不一样,那你就必须有非常强硬的证据才行 —— 不然你就是在把偏见又偷偷放回来。
有些现代机器学习算法的底层逻辑就是参考类预测。一切归结于你的“训练集(参考类数据)”有多大,以及你的“相似性度量(similarity metric)”抓得准不准,说白了就是把“找同类”这个动作给工业化了 [7]。
要知道自己做这件事会怎样,你最该考察的是和你相似的人、在做相似的事情时,最后都怎么样了。
参考类预测(以下简称 RCF)就是强迫你从“我是一个故事”切换到“我是一个样本” —— 故事负责解释你是谁,参考类负责预测你会怎样。
✵
现实世界的应用案例 #
每个自命不凡的项目都会被 RCF 教训。咱们看几个比较耀眼的应用。
一个是大型工程和公共投资,这是 RCF 的主战场。傅以斌看过那么多项目之后的结论是:如果不用 RCF 强制纠偏,你的工程几乎一定会超期和超支。怎么纠偏呢?香港政府给了一个范例。
2012 年,香港开始把参考类预测引入道路工程评估。他们把自己的 25 个道路项目,跟 863 个国际同类项目做比较,先看同类工程过去通常会怎么超支、怎么拖期,再反过来修正自己的计划。结果发现,在项目的筹备论证(Category C)阶段,因为方案还比较粗、不确定性大,如果你希望把风险控制到各自 P80 —— 也就是有 80% 的把握不超预算、不拖工期 —— 那么一开始报上来的数字就不能照单全收,而是要做「上调(uplift)」:成本要上调 44%,工期要上调 75% [8]。
越是项目刚起步,大家最有激情、最容易拍胸脯的时候,你越不能信内部视角。工程界最贵的一句话,就是“我们这次能控制得住。”
一个是企业并购。每个 CEO 都喜欢收购别人的公司,因为这能让你的权力扩大,属于开疆拓土。CEO 说并购会带来协同效应,我们战略互补必能整合市场……但你只要看一看参考类就知道,平均而言,收购方公司的业绩并不会因为并购而改善,甚至会受到轻微负面影响 [9]。
CEO 对此会说:“别的公司并购失败是因为他们整合能力不行,我们公司这次不一样,我们的企业文化天下无敌!”学者们不得不想出更先进的办法,用机器学习把 RCF 自动化 [7],提高预测准确率 —— 从历史上找一批和这次高度相似的并购,把它们的结局摆出来,完了再听 CEO 解释为什么这次不会翻车。
一个是电影票房。如果你要投巨资拍一部大片,你最好先有效预测一下它能不能火。而以前好莱坞的火是一种玄学:2008 到 2012 年美国上映的电影里,超过一半都没有盈利,而前 10% 的电影却能吃掉将近 70% 的票房收入……可是没人知道谁能进前 10%。
与其讲情怀,不如看 RCF。2023 年发表的研究中 [10],有人用基于 RCF 的“随机森林(Random Forest)”模型,使用更细的颗粒度把电影进行分类,把“能否覆盖成本”预测准确度提高到了 90%。
还有一个是现在进行时,核聚变。现在 AI 算力中心导致美国电力不堪重负,科技巨头纷纷考虑用核聚变发电。我以前就是研究核聚变的,我非常不相信十年之内核聚变有商业化的可能性,可是巨头们明显要乐观得多。
OpenAI CEO 山姆·奥特曼(Sam Altman)自己就投了一家核聚变公司,叫 Helion。2021 年的时候,Helion 曾经宣称要在 2024 年发电。可是等到 2023 年跟微软签约时,电力交付的时间表被推迟到了 2028 年。2025 年 Helion 才开始建设面向微软供电的厂址。到 2026 年,Helion 说他们的原型机取得了“新的里程碑”……我不知道里程碑到底前进了多少,但我知道发电时间表一直在后退。
由于现在还没有一家核聚变设施能发电,我们没有现成的参考类,但是我们可以参考类似高复杂度的项目。有研究 [11] 用相似高难度项目估算,聚变的上调大约是 118%;如果你用国际级大型科研基础设施做参考类,上调甚至可能达到 220%。
简单说就是,如果一个核聚变项目说要多少投资,你最好准备三倍以上的钱。
就连号称整天思考「第一性原理」的马斯克,也逃不掉规划谬误。他承诺的特斯拉全自动驾驶(FSD)几乎每年都说“明年就能实现”,拖了将近十年。当年创办 SpaceX,马斯克用内部视角做预算,认为 1 亿美元足够发射 3 次火箭,怎么也成功了 —— 结果三次全部爆炸,公司濒临破产,最后靠砸锅卖铁凑出来的第 4 次发射才侥幸成功。最近马斯克又说 xAI 将很快大幅度领先所有 AI 公司,请问你信吗?
✵
从叙事转向样本 #
当你开始学习一门新技能,认为自己一个月就能精通,两个月就能靠它赚到钱的时候,当你准备周末搬家,认为半天就能打完包的时候,当你给新房装修设定 30 万元预算和三个月时间的时候,请你想一想前面这几个案例,和卡尼曼当年那个故事。
豪情万丈的愿望不是预测,下决心努力不是预测,基于需求的计划表更不是预测。你最好先想想自己过去那三次学习新技能,都是在第几天放弃的;看看别人家搬家平均会出几次幺蛾子;问问同小区、同户型,装修平均拖几天,超多少钱。
把自己只当个样本,会让你的计划精确很多,而且可以让你更有底气。
很多求职者,尤其刚毕业的大学生,对钱没有概念,不知道该要多少工资。有些人倾向于多要,但也有很多人是要少了。你应该考虑的不是你每月房租和生活开销需要多少钱,而是参考类。到各大招聘网站调研一番,找师兄师姐问一问,像你这样的学历和技能,在相应的城市大概值多少钱。别忘了,招聘方可是早就把你这样的人给研究得明明白白。
这就如同找对象,如果你想的是“像我这么优秀的人,必须配什么什么样的人”这种内部叙事,靠谱的婚介服务给你的推荐就一定会让你失望 —— 因为它用的是 RCF。
✵
结语:借用旁观者的眼睛 #
当然不是每个人都应该活成中位数。很多人都在某一方面与大多数人不同 —— 但如果你找对了参考类,你会发现你跟不在少数的人很相似。
每个人都是特殊的。但你的天赋、资源和方法论,是否特殊到让你不属于当前这个参考类呢?如果是那样的话,你还是不能听从内部叙事 —— 你属于下一个参考类。
每个进京赶考的读书人都觉得自己会拯救中国,打算主导改革匡扶正义。殊不知主考官看到的不是热血,而是你的门路、师承、年龄和品性 —— 他们太知道像你这样开局的人最后都去了哪里了……
具体做事,不妨用内部叙事给自己打气;决策,却必须用外部参考类给自己泼冷水。
注释 #
[1] Buehler, Roger, Dale Griffin, and Michael Ross. 1994. “Exploring the ‘Planning Fallacy’: Why People Underestimate Their Task Completion Times.” Journal of Personality and Social Psychology 67 (3): 366–81.
[2] Flyvbjerg, Bent, Mette K. Skamris Holm, and Søren L. Buhl. 2003. “How Common and How Large Are Cost Overruns in Transport Infrastructure Projects?” Transport Reviews 23 (1): 71–88.
[3] Flyvbjerg, Bent, and Dan Gardner. How Big Things Get Done: The Surprising Factors That Determine the Fate of Every Project, from Home Renovations to Space Exploration and Everything In Between. New York: Currency, 2023. 我们专栏有过解读:《精英日课》第五季,怎样做成大事1:慢慢谋定,快速行动
[4] Kahneman, Daniel, and Dan Lovallo. 1993. “Timid Choices and Bold Forecasts: A Cognitive Perspective on Risk Taking.” Management Science 39 (1): 17–31.
[5] Flyvbjerg, Bent. 2008. “Curbing Optimism Bias and Strategic Misrepresentation in Planning: Reference Class Forecasting in Practice.” European Planning Studies 16 (1): 3–21.
[6] Bent Flyvbjerg. “From Nobel Prize to Project Management: Getting Risks Right.” Project Management Journal, 37(3): 5–15, 2006.
[7] Bi, Wenbin, and Qiusheng Zhang. 2021. “Forecasting Mergers and Acquisitions Failure Based on Partial-Sigmoid Neural Network and Feature Selection.” PLOS ONE 16 (11): e0259575.
[8] Flyvbjerg, Bent, Chi-keung Hon, and Wing Huen Fok. 2016. “Reference Class Forecasting for Hong Kong’s Major Roadworks Projects.” Proceedings of the Institution of Civil Engineers 169 (6): 17–24.
[9] King, David R., Dan R. Dalton, Catherine M. Daily, and Jeffrey G. Covin. 2004. “Meta-Analyses of Post-Acquisition Performance: Indications of Unidentified Moderators.” Strategic Management Journal 25 (2): 187–200.
[10] Einberg, Isak, and Arian Hanifi. 2023. Forecasting U.S. Movie Gross Revenues: A Random Forest Classifier Approach Based on Pre-production Data. Stockholm: KTH; de Souza, Thiago L. D., et al. 2023. “Revisiting Predictions of Movie Economic Success: Random Forest Applied to Profits.” PLOS ONE 18 (3).
[11] Brown, Chris, Hanni Lux, and James R. Cowan. 2024. “Reference Class Forecasting and Its Application to Fusion Power Plant Cost Estimates.” IEEE Transactions on Plasma Science 52 (9): 3628–33.