自由能原理：活着就是对齐

这一讲的思维工具叫「自由能原理（Free Energy Principle, FEP）」，它是英国神经科学家卡尔·弗里斯顿（Karl Friston）最早在 2005 年前后提出来的。我们之前提到了一点点，你可能也从别处听说过这个名词，但你未必知道它的厉害。

弗里斯顿 2010 年的一篇讲自由能理论的综述论文 [1] 现在是神经科学领域被引用次数最高的文献之一。自由能原理号称是“神经科学的大统一理论”，被认为是物理学、生物学、神经科学与控制论的集大成之作……

因为它既回答了「生命是什么」，又告诉我们「生命应该干什么」。

✵

你不妨自己先想想生命是什么。

一颗恒星，盛年时期那么壮观，质量大到吓人，能量输出高到离谱，可它还是会湮灭散开，它不会给你生出一颗新的恒星来。而一粒种子，风一吹就跑，但它居然能一层层长出结构，维持结构，复制结构，乃至于长成大树还繁衍后代。它们的区别在哪呢？

从物理学的角度看，走向无序是最自然的事情，这就是熵增定律！你再强，终究也得跟自然完全融为一体，再也看不出来。

可是生命体，却是一种长期都“搅不匀”的东西。它能在时间里保持形状、保持边界、保持自我。当然这并不违反熵增定律，因为如果你把它和周围环境在一起算总账，熵还是增加 —— 但生命个体作为一个开放系统，却做到了长期保持结构不散，而且还能繁衍后代。

生命是怎么做到的呢？我们如果知道这个秘密，就可以主动把这件事儿做得更好，岂不是获得更蓬勃的生命力吗？

弗里斯顿的自由能原理说，生命的策略是把生存当成一个优化问题：你要想持续活着而不被打散，就得尽量把「自由能」给最小化。

且听我细说。这可能是有史以来讲解自由能原理最通俗易懂的版本。

✵

想象你是水里的一条鱼，你怎样才能愉快地生活呢？很多养生之道说什么要“融入自然” —— 但你不可能完全融入环境，否则你就成了一堆水而不是鱼。

在水里做水是容易的，你没有内外之别，外界怎么变，你就怎么变；你不需要感知、记忆和智能，你随波逐流甚至连形状都谈不上。但做鱼，可就不容易了。

因为你非得坚持有个形状、非得保留独立性，所以你很脆弱。

有形状就有边界，有边界就有“我”和“非我”，有“我”，就得确保这个“我”别被环境抹平。

熵增定律会强烈地想要把你抹平。为了不被抹平，你必须确保自己跟环境能融洽地相处。为了保持融洽，你就必须做两件事儿 ——

一个是改造自己，让自己的结构更能适应环境；一个是改造环境或者换环境，让环境的秩序对自己更友好。

简单说，活着就是让自己跟环境双向「对齐」。

这就是自由能原理最根本的洞见。我对比一下你就明白了。以前人们的认识，是说生命是靠「刺激-反应」活着：看到吃的就张嘴，看到危险就跑。自由能原理告诉你，不是。那样太慢了容易死，因为环境是复杂多变的！真正的生命必须有智能，必须是一台「预测机器」：你不能等着环境来弄你，你必须走在时间前面 —— 所谓对齐，就是你不断地预测环境会发生什么，让你的预期和你接收到的输入别差得太离谱，确保环境的变化符合你的生存需求。

所谓「自由能」，原本是个物理学术语，弗里斯顿借来专门描写这种对齐的失败程度。这里有复杂的数学，严格说来应该叫「变分自由能」……但是那些你都不用管，你只需要知道 [2]：

自由能 ≈ 惊讶（Surprise）。

这个惊讶可不是惊喜，而是统计学意义上的意外，或者说就是你跟环境的不融洽程度。

比如你是一条热带鱼，基因设定的生活环境是 25℃ 的水里。如果感官告诉你现在水温是 25℃，你就一点都不惊讶，自由能很低，你很舒服。而如果感官告诉你现在水温是 5℃，你就很惊讶了：不解决这个高自由能，你的系统就会崩溃。

自由能原理的核心思想，就是凡是能长期存在的系统，都在一直努力最小化自由能，也就是最小化惊讶。

✵

要理解生命具体是怎么做的，我们先要了解一个概念叫「马尔可夫毯（Markov blanket）」。它相当于是把生命系统和外部环境分开来的那张皮，也就是“我”和世界的交界面。

马尔可夫毯包含两类状态：「感官状态（sensory states）」是外部影响内部的唯一入口；「行动状态（active states）」是内部影响外部的唯一出口。

你只能通过马尔可夫毯上的感官状态去推测外面的世界正在发生什么，你看的不是世界本身，而是世界打在你毯子上的投影。同样地，你是通过马尔可夫毯干预外界。

马尔可夫毯就是你连接内外的信息输入输出接口。生命想活着就必须经营好这张毯子：让入口足够可靠，让出口足够有效，让内外之间形成可持续的耦合。

如果你的预测跟感官状态一致，你很好；但我们的预测常常跟感官状态不一致，总有惊讶。对此你有两个基本对策，对应于前面说的改造自己和改造环境 ——

第一招是改变想法去适应世界，这叫「知觉推断（Perceptual Inference）」。比如你走夜路看到前方有个黑影，还以为是鬼，走近才发现是树桩。于是你更新信念，说啊，那是树桩。这就是通过改变内部模型来降低自由能。

第二招是改变世界去符合自己的想法，这叫「主动推断（Active Inference）」。比如你的生理构造要求环境必须是暖和的，可是现在房间里很冷，你总不能临时改变生理构造。你可以穿上厚衣服或者打开暖气，这就通过行动改变了周围的小环境，也是降低自由能。

不过主动推断还不只是改造环境，它还包括主动到外边探测一下周围的环境，以便更新信念。知觉推断的精度也很关键，你得能判断哪些信息是重要的信号，哪些只不过是噪声，哪些该相信哪些应该忽略。

你品一品这个意境。我们前面说的内核自我，就可以看作是信息边界包围下的一个集合体。一切都是信息。

在这个视角下，不只是动植物，还包括一个细胞、一家公司、一个组织、一种文化，只要它们作为系统能稳定存在一段时间，就必定遵循了最小化自由能的策略。要想在不确定环境里维持边界，你就必须形成某种「预测—误差—更新/行动」的闭环。

就拿公司来说，它所处的环境就是市场；它的自身结构就是战略、文化、流程、团队能力。它的马尔可夫毯上的感官状态就是用户反馈、财务数据和市场信号；行动状态就是产品迭代、销售策略和组织调整。公司是一台消除惊讶的机器，管理公司就是要快速收集惊讶（客户投诉、市场异动），然后通过高频的知觉推断（复盘、调整战略）和主动推断（发布新产品、改变市场规则）消除误差。

想要延续自己的独立性，防止崩溃，你这个系统就必须跟环境融洽相处 —— 也就是尽量降低自由能。

✵

这听起来似乎很简单，你可能马上说，那我直接找个最熟悉的环境待着不就行了？我完全没有任何惊讶！其实不行，因为你需要觅食、你需要繁衍、你需要发展壮大，而且你不变环境也可能变，所以你必须主动出去探索才行。

你不是为了“预测”而预测，你是为了生存而预测。

所以你不能寻求直接把惊讶变成0。为了将来的惊讶不至于措手不及，你现在最好来点有限的小惊讶。一切的艺术就在于这个惊讶的「度」：太大你容易崩溃，太小你会被钝化。

在我看来，操作自由能原理的一切心法，就在于怎么把握当前的惊讶度。

比如幼儿园孩子，本来就刚刚接触世界看什么都新鲜，你要是让他们每天接触太多新东西动不动就一惊一乍，他们肯定手足无措啥也学不会。最好让环境尽量稳定，每天稍微来点新东西，他们才能学进去。有人用自由能原理分析过蒙台梭利（Montessori）式教育 [3]，发现他们就是精心设计了一种低熵的教室环境，连每件教具都有固定位置，这就降低了儿童探索时的无效惊讶，才能专注学习。

恰到好处的惊讶，正是「刻意练习」理论说的那个「学习区」（对比于舒适区和恐慌区），也是「心流」和「自我决定理论」说的那种「胜任感」，也是我们精英日课专栏一再讲过的那个「喜欢 = 熟悉 + 意外」，也是咱们前面刚说过的适当来点不确定性。这就是生命的一个最基本性质！

我们需要降低惊讶，但我们也需要稍微有点惊讶。平时来点可控的小惊讶，你才能提前对齐，才不至于面对崩溃式的大惊讶。

这也是「好奇心」的根本。好奇心不是可有可无的情绪调料，而是智能的战略设定 [4]。

现在主流 AI 都是基于强化学习训练，对好奇心接纳不足。弗里斯顿本人已经加入了一家 AI 创业公司叫 VERSES AI [5]，打算用自由能原理的思想开发新型神经网络。

真正的稳定不是把变化消灭，而是把变化纳入模型。

✵

咱们看几个自由能原理的日常应用。

最基本的用法是当你遭遇任何难以接受的惊讶的时候，你都应该想一想让谁跟谁对齐：是自己这个模型不对，还是外界环境不对？如果你发现周围同事水平都太低，那可能是环境不对你需要换环境；但如果你发现社会很不公平、这个世界整个就不对，那你也许需要更新自己的认知模型。

更好的用法是主动寻求「小惊讶」。比如考前复习，多数人喜欢看笔记甚至对着课本猛念，因为这样惊讶最小最舒服 —— 可是你此时不惊讶，考试就得面临大惊讶。正确做法是主动推断，找些测试题来做，制造适度的惊讶，暴露你模型的漏洞，才能把不确定性压下去。

人们最常犯的错误就是因为害怕大惊讶而沉溺于当前的不惊讶。

比如说「拖延症」。你明明有篇论文需要写，可是你不写 —— 这其实不是懒，是你在躲避预期的高惊讶。你正确地预测到写论文这个活动会遇到很多困难、可能失败，所以你自动转向最小化预期自由能的路径，也就是躺在床上刷手机。

可是你终将面对交稿日期。自由能原理的建议是把宏观预测改成微观预测：我只想打开电脑，建一个空白文档，写个标题，这总能做到吧？你做到，让预测成功，获得微小的多巴胺，动能就起来了。

很多痛苦不是你的情绪太强，而是你的模型太硬。有一种计算精神病学视角的解释框架认为，「抑郁症」是因为患者持有关于未来的极度负面的先验信念 [6]，比如“我做什么都是失败的”。结果就算外界给正反馈，比如家人鼓励、做事取得小成功，你明明看到了自己预测的误差，却直接给当作低精度噪音忽略了。你的模型无法更新，就陷入自我验证的负面循环。

也许抑郁是因为马尔可夫毯过滤掉了好的信息。那你能不能对好的信息更敏感一点？如果你预测自己发出这封邮件人家也不会回，可是事实证明人家真回了，你能不能修改自己的模型，变振作一点？

按照自由能原理，你的性格、偏好和价值观，你的内核自我，本质上是你过去为了适应环境而固化下来的、具有极高精度的预测模型；而你的习惯，则是模型的自动化执行，它节省了计算自由能的能量成本。为什么改变习惯这么难？因为改变意味着拆解模型，得让系统暂时暴露在焦虑和不确定 —— 也就是高自由能 —— 之中。

你难以改变习惯是因为你不愿意支付短期自由能上升的成本。

制造一个小到几乎不会失败的行动，让正面预测成真，是主动改进模型的通用好办法。

✵

总而言之，活着就是对齐：要么让你的理解跟世界对齐，要么让世界跟你对齐。我们不能只是被动地靠知觉推断，我们必须主动出去探索和行动 —— 这是作为独立个体维护自身不崩溃的基本义务。

因为你不想在水里做一堆水，你坚持要做鱼。

你跟环境必须内外有别，又必须融洽相处。

我问 AI 对自由能原理还有没有更深的洞见，Gemini 说了一个特别浪漫的：所谓爱一个人，就是将对方纳入了自己的马尔可夫毯之内 ——

花时间相处，你们学习了对方的生成模型，最终双方的相互预测误差降到最低。你不需要言语就能懂他，他不需要解释就能懂你。你们形成一种共享的低熵状态。

在这个混乱的宇宙里找到一个能与你共同最小化自由能的人，建立一个共同抵抗风雨的超生物体，这不就是最科学的爱情吗？

注释

[1] Friston, Karl. “The Free-Energy Principle: A Unified Brain Theory?” Nature Reviews Neuroscience 11, no. 2 (2010): 127–138.

[2] 这句话的严格说法是：变分自由能是“异度/意外度（surprisal）”的可计算上界。但你不必介意。

[3] Laura Desirèe Di Paolo, Ben White, Avel Guénin-Carlut, Axel Constant, Andy Clark; Active inference goes to school: the importance of active learning in the age of large language models. Philos Trans R Soc Lond B Biol Sci 7 October 2024; 379 (1911): 20230148.

[4] 精英日课第六季，《智能简史》3：学习的革命

[5] Denise Holt, Friston’s AI Law is Proven: FEP Explains How Neurons Learn, Medium, Aug 15, 2023. https://medium.com/@deniseholt1/fristons-ai-law-is-proven-fep-explains-how-neurons-learn-3718d3be69ac

[6] Chekroud, Adam M. “Unifying Treatments for Depression: An Application of the Free Energy Principle.” Frontiers in Psychology 6 (2015): 153.