参考类：当局者迷，旁观者清，你不特殊

Table of Contents

一个高中生每天刷题到深夜，常被自己流下的汗水感动。父母都说他一定行，他也认定只要这么拼命，就一定能考上清华。

一个都市女性坚信自己只要不将就，一定能等到那位身披金甲圣衣脚踏七彩祥云非她不娶的盖世英雄。

一个创业者刚刚想出了一个产品雏形，就已经在脑子里把用户增长曲线画成了火箭。

这些都是非常可爱的人。他们身上有一种真诚的英雄主义，他们是生活的主角，世界因为他们而精彩。但是他们都活在梦中。

我们说了，这个宇宙的第一性原理是叙事。人需要叙事给自己意义。我们都最好有一点热情，有一点想象，甚至有一点自我感动。可你要想科学计划，对未来做出靠谱预测，最有效的指导可不是你梦中的叙事，而是同类人、同类事已经发生过的经验。

这一讲的思维工具叫「参考类预测（Reference Class Forecasting, 简称 RCF）」。它本是一个预测算法，但在我看来，它更像是一个“反自恋装置”。如果你认为“我很特殊”、“我这次一定不一样”，你最好先用一下这个工具。

✵

梦想与现实的鸿沟 #

关于梦想和现实的差距，有个现成的规律，叫「规划谬误（Planning Fallacy）」。

心理学家罗杰·比勒（Roger Buehler）等人的一个研究是这样的 [1]。让一群学生估算他们各自完成毕业论文还需要多少天，学生们平均给出的预期是 33.9 天。比勒说不行，你们太乐观了，你们来一个最悲观的估计！这回平均是 48.6 天。

你猜他们实际上用了多少天？55.5 天。

规划谬误说的就是人一做计划，就会系统性地低估时间、成本和风险，同时还高估收益。现实往往比你最悲观的估计还要悲观。

那你说是不是只有普通人这样，要是做正规大项目人们就会准确估计呢？不是。我们前面提到过的丹麦经济学家傅以斌（Bent Flyvbjerg）是大型项目专家，他跟合作者研究了 258 个交通基础设施项目，发现普遍存在延期和成本超支 —— 其中铁路项目平均超支 45%，桥梁与隧道 34%，公路 20% [2]。傅以斌专门写了本书谈论大项目规划失败问题 [3]，其中最著名的例子是悉尼歌剧院：原本预算 700 万美元，计划 4 年完工，结果花到 1.02 亿美元，14 年才完工。

规划谬误是「一厢情愿」这个成语的现代版，它是大脑里一系列幻觉生成器共同造就的 ——

「乐观偏差（Optimism Bias）」告诉你“这次一定顺”
「确认偏误（Confirmation Bias）」让你只搜集利好证据
「控制错觉（Illusion of Control）」让你以为世界井井有条、意外情况都在掌控之中
「自利归因（Self-Serving Attribution）」让你把上次翻车怪到天气、队友和甲方头上
「幸存者偏差（Survivor Bias）」和「可得性偏差（Availability Bias）」让你只看见成功故事而看不见沉在水底的尸体……最后「叙事谬误（Narrative Fallacy）」则负责把这些碎片拼成一部热血电影。

你脑子里排练的是剧本，而不是真实世界。

而你之所以用剧本思考，是因为你使用的是「内部视角（inside view）」。你自己看自己，就只知道盯着这一件事的细节、你的努力、你的诚意、你的资源配置 —— 你心想这还能有啥问题？

当局者迷旁观者清，你需要外部视角。

✵

内部视角与外部视角 #

「外部视角（Outside View）」和参考类预测都起源于卡尼曼 [4]，后来则是由傅以斌把参考类预测从心理学推广到了工程实践 [5]。

简单说，内部视角看的是你的个案信息（singular information），而外部视角看的则是分布信息（distributional information）：在别人眼里，你只是一个受制于客观规律的统计学数据点，你并不特殊。

外部观察者关心的是跟你条件差不多的同类事情 —— 也就是你的「参考类（Reference Class）」 —— 的分布：平均水平如何、中位数是什么、尾部风险是怎样、失败率是多少，并且以这些统计数据来推测你会如何。

内部视角盯住本项目，外部视角先看同类项目，这就是「当局者迷，旁观者清」的现代认知科学版本。旁观者未必比你聪明，但旁观者的好处是没有你那么多自恋情结：人家把你当成样本，而不是当主角。

这里有个最经典的故事，来自卡尼曼本人，收录在《思考，快与慢》一书中。

1970 年代，卡尼曼带队编写一本给高中生的决策学教材。团队第一次开会，卡尼曼问，我们多长时间能把这本书编完？大家群情激昂，信誓旦旦地说：两年！最多两年就能搞定！但卡尼曼留了个心眼，转头问团队里一位教育专家：“你认识的、跟我们条件差不多的团队，编这样一本书通常要几年？”

专家说大概 7 到 10 年，而且有 40% 的团队最后干脆放弃了。

卡尼曼很震惊，但他想我们团队肯定不至于，我们效率更高。

……结果卡尼曼团队花了整整 8 年才把书搞出来。而那时候教育部已经取消了这门课的教学需求。

你以为你们不一样，其实每个人都觉得自己不一样。现实是，在统计学意义上大家都一样。

✵

参考类预测的三步法 #

傅以斌把参考类预测标准化成了三个步骤 [6]：

第一步： 找一个数量足够多的、包含和你类似的项目的「参考类」 —— 不是你喜欢的榜样，而是找一组和你足够相似、而且已经结束的案例；
第二步： 看看这个参考类的分布，找到它的基准线，包括平均成本、时间、失败率等等；
第三步： 把你自己的项目放进去对比，根据客观情况做微调：我更像是中位数，还是应该更保守一点？

第三步是最考验人的一步。其实最简单的办法就是直接用参考类里的中位数来预测自己。傅以斌再三强调，如果你非要说你跟别人不一样，那你就必须有非常强硬的证据才行 —— 不然你就是在把偏见又偷偷放回来。

有些现代机器学习算法的底层逻辑就是参考类预测。一切归结于你的“训练集（参考类数据）”有多大，以及你的“相似性度量（similarity metric）”抓得准不准，说白了就是把“找同类”这个动作给工业化了 [7]。

要知道自己做这件事会怎样，你最该考察的是和你相似的人、在做相似的事情时，最后都怎么样了。

参考类预测（以下简称 RCF）就是强迫你从“我是一个故事”切换到“我是一个样本” —— 故事负责解释你是谁，参考类负责预测你会怎样。

✵

现实世界的应用案例 #

每个自命不凡的项目都会被 RCF 教训。咱们看几个比较耀眼的应用。

一个是大型工程和公共投资，这是 RCF 的主战场。傅以斌看过那么多项目之后的结论是：如果不用 RCF 强制纠偏，你的工程几乎一定会超期和超支。怎么纠偏呢？香港政府给了一个范例。

2012 年，香港开始把参考类预测引入道路工程评估。他们把自己的 25 个道路项目，跟 863 个国际同类项目做比较，先看同类工程过去通常会怎么超支、怎么拖期，再反过来修正自己的计划。结果发现，在项目的筹备论证（Category C）阶段，因为方案还比较粗、不确定性大，如果你希望把风险控制到各自 P80 —— 也就是有 80% 的把握不超预算、不拖工期 —— 那么一开始报上来的数字就不能照单全收，而是要做「上调（uplift）」：成本要上调 44%，工期要上调 75% [8]。

越是项目刚起步，大家最有激情、最容易拍胸脯的时候，你越不能信内部视角。工程界最贵的一句话，就是“我们这次能控制得住。”

一个是企业并购。每个 CEO 都喜欢收购别人的公司，因为这能让你的权力扩大，属于开疆拓土。CEO 说并购会带来协同效应，我们战略互补必能整合市场……但你只要看一看参考类就知道，平均而言，收购方公司的业绩并不会因为并购而改善，甚至会受到轻微负面影响 [9]。

CEO 对此会说：“别的公司并购失败是因为他们整合能力不行，我们公司这次不一样，我们的企业文化天下无敌！”学者们不得不想出更先进的办法，用机器学习把 RCF 自动化 [7]，提高预测准确率 —— 从历史上找一批和这次高度相似的并购，把它们的结局摆出来，完了再听 CEO 解释为什么这次不会翻车。

一个是电影票房。如果你要投巨资拍一部大片，你最好先有效预测一下它能不能火。而以前好莱坞的火是一种玄学：2008 到 2012 年美国上映的电影里，超过一半都没有盈利，而前 10% 的电影却能吃掉将近 70% 的票房收入……可是没人知道谁能进前 10%。

与其讲情怀，不如看 RCF。2023 年发表的研究中 [10]，有人用基于 RCF 的“随机森林（Random Forest）”模型，使用更细的颗粒度把电影进行分类，把“能否覆盖成本”预测准确度提高到了 90%。

还有一个是现在进行时，核聚变。现在 AI 算力中心导致美国电力不堪重负，科技巨头纷纷考虑用核聚变发电。我以前就是研究核聚变的，我非常不相信十年之内核聚变有商业化的可能性，可是巨头们明显要乐观得多。

OpenAI CEO 山姆·奥特曼（Sam Altman）自己就投了一家核聚变公司，叫 Helion。2021 年的时候，Helion 曾经宣称要在 2024 年发电。可是等到 2023 年跟微软签约时，电力交付的时间表被推迟到了 2028 年。2025 年 Helion 才开始建设面向微软供电的厂址。到 2026 年，Helion 说他们的原型机取得了“新的里程碑”……我不知道里程碑到底前进了多少，但我知道发电时间表一直在后退。

由于现在还没有一家核聚变设施能发电，我们没有现成的参考类，但是我们可以参考类似高复杂度的项目。有研究 [11] 用相似高难度项目估算，聚变的上调大约是 118%；如果你用国际级大型科研基础设施做参考类，上调甚至可能达到 220%。

简单说就是，如果一个核聚变项目说要多少投资，你最好准备三倍以上的钱。

就连号称整天思考「第一性原理」的马斯克，也逃不掉规划谬误。他承诺的特斯拉全自动驾驶（FSD）几乎每年都说“明年就能实现”，拖了将近十年。当年创办 SpaceX，马斯克用内部视角做预算，认为 1 亿美元足够发射 3 次火箭，怎么也成功了 —— 结果三次全部爆炸，公司濒临破产，最后靠砸锅卖铁凑出来的第 4 次发射才侥幸成功。最近马斯克又说 xAI 将很快大幅度领先所有 AI 公司，请问你信吗？

✵

从叙事转向样本 #

当你开始学习一门新技能，认为自己一个月就能精通，两个月就能靠它赚到钱的时候，当你准备周末搬家，认为半天就能打完包的时候，当你给新房装修设定 30 万元预算和三个月时间的时候，请你想一想前面这几个案例，和卡尼曼当年那个故事。

豪情万丈的愿望不是预测，下决心努力不是预测，基于需求的计划表更不是预测。你最好先想想自己过去那三次学习新技能，都是在第几天放弃的；看看别人家搬家平均会出几次幺蛾子；问问同小区、同户型，装修平均拖几天，超多少钱。

把自己只当个样本，会让你的计划精确很多，而且可以让你更有底气。

很多求职者，尤其刚毕业的大学生，对钱没有概念，不知道该要多少工资。有些人倾向于多要，但也有很多人是要少了。你应该考虑的不是你每月房租和生活开销需要多少钱，而是参考类。到各大招聘网站调研一番，找师兄师姐问一问，像你这样的学历和技能，在相应的城市大概值多少钱。别忘了，招聘方可是早就把你这样的人给研究得明明白白。

这就如同找对象，如果你想的是“像我这么优秀的人，必须配什么什么样的人”这种内部叙事，靠谱的婚介服务给你的推荐就一定会让你失望 —— 因为它用的是 RCF。

✵

结语：借用旁观者的眼睛 #

当然不是每个人都应该活成中位数。很多人都在某一方面与大多数人不同 —— 但如果你找对了参考类，你会发现你跟不在少数的人很相似。

每个人都是特殊的。但你的天赋、资源和方法论，是否特殊到让你不属于当前这个参考类呢？如果是那样的话，你还是不能听从内部叙事 —— 你属于下一个参考类。

每个进京赶考的读书人都觉得自己会拯救中国，打算主导改革匡扶正义。殊不知主考官看到的不是热血，而是你的门路、师承、年龄和品性 —— 他们太知道像你这样开局的人最后都去了哪里了……

具体做事，不妨用内部叙事给自己打气；决策，却必须用外部参考类给自己泼冷水。

注释 #

[1] Buehler, Roger, Dale Griffin, and Michael Ross. 1994. “Exploring the ‘Planning Fallacy’: Why People Underestimate Their Task Completion Times.” Journal of Personality and Social Psychology 67 (3): 366–81.

[2] Flyvbjerg, Bent, Mette K. Skamris Holm, and Søren L. Buhl. 2003. “How Common and How Large Are Cost Overruns in Transport Infrastructure Projects?” Transport Reviews 23 (1): 71–88.

[3] Flyvbjerg, Bent, and Dan Gardner. How Big Things Get Done: The Surprising Factors That Determine the Fate of Every Project, from Home Renovations to Space Exploration and Everything In Between. New York: Currency, 2023. 我们专栏有过解读：《精英日课》第五季，怎样做成大事1：慢慢谋定，快速行动

[4] Kahneman, Daniel, and Dan Lovallo. 1993. “Timid Choices and Bold Forecasts: A Cognitive Perspective on Risk Taking.” Management Science 39 (1): 17–31.

[5] Flyvbjerg, Bent. 2008. “Curbing Optimism Bias and Strategic Misrepresentation in Planning: Reference Class Forecasting in Practice.” European Planning Studies 16 (1): 3–21.

[6] Bent Flyvbjerg. “From Nobel Prize to Project Management: Getting Risks Right.” Project Management Journal, 37(3): 5–15, 2006.

[7] Bi, Wenbin, and Qiusheng Zhang. 2021. “Forecasting Mergers and Acquisitions Failure Based on Partial-Sigmoid Neural Network and Feature Selection.” PLOS ONE 16 (11): e0259575.

[8] Flyvbjerg, Bent, Chi-keung Hon, and Wing Huen Fok. 2016. “Reference Class Forecasting for Hong Kong’s Major Roadworks Projects.” Proceedings of the Institution of Civil Engineers 169 (6): 17–24.

[9] King, David R., Dan R. Dalton, Catherine M. Daily, and Jeffrey G. Covin. 2004. “Meta-Analyses of Post-Acquisition Performance: Indications of Unidentified Moderators.” Strategic Management Journal 25 (2): 187–200.

[10] Einberg, Isak, and Arian Hanifi. 2023. Forecasting U.S. Movie Gross Revenues: A Random Forest Classifier Approach Based on Pre-production Data. Stockholm: KTH; de Souza, Thiago L. D., et al. 2023. “Revisiting Predictions of Movie Economic Success: Random Forest Applied to Profits.” PLOS ONE 18 (3).

[11] Brown, Chris, Hanni Lux, and James R. Cowan. 2024. “Reference Class Forecasting and Its Application to Fusion Power Plant Cost Estimates.” IEEE Transactions on Plasma Science 52 (9): 3628–33.