能耐寻求定理:为什么君子不器是最佳生存策略?

现在我们正式进入第一模块,人生成长战略层面的思维工具。这一讲说一个很新的理论,是计算机科学家研究AI智能体(AI agents)时发现的,叫「能耐寻求定理(Power‑Seeking Theorems)」。我感觉这个定理也能用在人身上,而且是人生最基础、最决定性的道理 —— 它暗合了咱们中国人说的「君子不器」。
一个很难受,也很难看的现实是,人们很多时候是处在被驱使的状态。打工人白天看老板眼色晚上看老婆脸色,学生白天听老师的晚上听家长的,别人让干啥你就必须干啥,别人不说你连一点 自由度都没有,这日子能过吗?被驱使会导致慢性压力,长期慢性压力会让皮质醇激素水平上升,于是触发炎症反应,结果健康会跟精神一起恶化。
在我看来,君子不器的精义就是不要被驱使 —— 不要去做个器具。器具是别人可以随便拿来拿去用的,君子可不能这样。
这也是康德道德哲学的核心思想,而且康德说得更直白也更绝对:人只能是目的(end),而不能只是手段(means)。
说白了就是不要做工具人。不管是对自己还是对别人,人就是人,不能把人给物化。
可我们每天就是会被各种力量驱使,就是很被动,怎么做,才是君子不器呢?我们应该追求什么呢?孔子给的是主张,康德给的是原则,能耐寻求定理,则给你方法。
✵
驱使人的不一定非得是某个人或者某个组织,它更可能是一些别的东西……比如贫困。贫困不只是经济问题,而且是认知问题:一个长期处于贫困状态的人遇到什么事儿都会首先提醒自己贫困: 我就这么点钱怎么用?我下一笔钱什么时候才能到手?以至于再也想不了别的。
用赛德希尔·穆来纳森(Sendhil Mullainathan)和埃尔德·沙菲尔(Eldar Shafir)的《稀缺》(Scarcity)[1] 一书的说法,这叫「隧道效应(tunneling)」:就如同进入一个隧道,只能看见眼前的光亮,周围的东西都看不见了。稀缺感,会让认知带宽窄化。
有人在美国和印度都做过一个实验,让人在实验室里想象处于稀缺状态 —— 比如说汽车突然坏了、修车需要花一大笔钱 —— 对生活富裕的人来说这不是个事儿,但是对于低收入者来说,这个状 态会让他们在智商测验中当场下降13分 [2]!
只盯着这一件事儿,来不及想别的,以至于都被降智,这不就是被驱使吗?
再看那些吸毒、赌博、酗酒的人,不也是认知窄化吗?他们只能看见一样东西。还有长期饥饿的人,看见什么都能联想到食物。这些人都是被自己的某种欲望所奴役。那你说贫困和饥饿都是不 得已,人家也不想如此啊!没错,我这里不是道德谴责,我只是说这种状态很不好。如果让康德说,就是他们都把自己当成了工具;用中国话说这就是「小人役于物」。
我们再进一步,那些为了升职和奖金而拼命工作不顾健康的人,那些以爱的名义舍弃自己的生活、全身心就抓孩子学习的人,那些眼中只能看见权力,只知道有领导不知道有原则的人……其实也 都是「器」。
以我之见,成为「器」的本质就是瞄准一个单独的目标优化,而牺牲生活的其他维度。因为你眼中只有这个目标函数,所以你就是这个目标的奴隶。
其实每个人都曾经或多或少地,在生命的某些阶段陷入过「器」的状态。因为贫困也好,因为爱情也罢,又或者是为了一场考试、一个项目,目中唯此一物,心中只剩一人,其实都是有害的。 你的认知带宽越来越窄,你的敏感度大大下降,你陷入隧道,你没有多样的兴趣和丰富的角色,你一点都不繁荣。
君子不器,实在是健全人格的最低限度要求。
✵
那你说人生总要有所追求,我们也不能整天就只是修身养性,更不能躺平啊?我们总要对社会有所贡献才好 —— 「器」的问题是不是在于只有一个目标函数,我们多几个目标是不是就算君子不 器了呢?不是的。
一个目标都把人累成这样,多个目标岂不是更难受?
君子和小人的真正区别是主动和被动。
君子在每个特定时刻完全可以盯着一个目标,但他是那个目标的主人而不是奴隶,他可以随时跳出那个叙事。比如一个役于权力的人会把上级的意志看得比天都高,你让我干啥我就干啥 —— 而 一个运用权力的人面对同样的命令,则是你说的符合我的价值观我就办,你说的不对我宁可辞职,逼急了我还可能造反!
君子不器就是你必须高于任何目标函数。马斯克有句话说得好 [3]:
「永远不要把自己依附于某个人、某个地方、某家公司或某个项目。你只能依附于一项使命、一种召唤、一个目的。」
目标函数必须为目的服务。使命(mission)、召唤(calling)和目的(purpose)属于你自己,是你人生意义的一部分,你乐在其中。早就有研究发现,那些活着有目的的人,会活得更健康也更长 [4]。
为一项事业艰苦努力并不等于成为工具人。这里有微妙但是极为重要的区别。
✵
可能有人说,我这辈子就想多挣钱,为此哪怕当个工具人我也无所谓,这行不行呢?也不行。世人喜欢的很多东西,包括金钱,往往不是直接追求就能得到的,它更像是你做别的事业的副产品 。
如果一个人眼里只有钱,他其实赚不到很多钱。你想想谁会愿意跟一个斤斤计较、做什么都考虑钱的人合作呢?他能创造多大价值?
再比如学术声望。学历可以用刷题得到,但学问不能。学术声望不是考试考出来的。那些拼命准备考试的人,只不过是想冒充一个名额挤进人家的圈子而已。
还有社会地位。人们穿戴奢侈品、搞炫耀式消费都是想发出地位信号,可是真正有地位的人往往不屑于使用这些外部符号,甚至认为过度炫耀是缺乏自信的表现。
还有人追求“好心情”,把快乐当成执念,说今天我过生日谁让我一时不痛快我就让他一辈子不痛快!殊不知刻意营造的好心情是虚假的……
这些好东西的特点是你越直接追求它,你就越难以得到它;你放下它去做别的,它反而会自动来找你。中国话叫「曲则全,枉则直」,英文也有个说法叫「斜行定律(obliquity)」[5],意思 都是直线前进往往走不远,你必须走间接路线实现目标。这是因为复杂系统里的相互作用往往是不直接和不确定的,你只能安心探索,回报才会在你不经意的地方出现。
如果每发一篇论文固定奖励一万块钱,科研工作者就会发一大堆垃圾论文。诺贝尔奖肯定不是这么激励出来的。明知不一定有回报,为什么有的人还要坚持探索呢?那一定是乐在其中的人,是 有内在动机的人,是把这个事业视为自己的使命的人,是君子。
好,现在问题来了:君子也不能只为了乐趣工作,你总要严肃对待自己的事业才行,你肯定也有强烈的竞争意识 —— 那如果君子不争副产品,你到底应该争什么呢?
这就是「能耐寻求定理」登场的时刻。
✵
这是俄勒冈州立大学的计算机科学家亚历山大·特纳(Alexander Turner)在2021年发表的一篇论文中的理论 [6]。特纳的研究说,一个AI智能体要通过获得奖励进行强化学习,它面对复杂环境,如果不知道奖励会出现在哪里,应该采用什么策略呢?
答案是寻求 power。这个词一般翻译成“权力”,但这里不是那种政治上的上下级关系,我觉得叫“能耐”可能更准确一些。能耐是你对环境的影响力,特别是你所拥有的「选项(options)」。
能耐寻求定理说,作为智能体,你要尽量争取自己在未来拥有更多的可能性,那么你就能在绝大多数情况下把奖励最大化。
比如面前有两条路:左边是个死胡同,右边通向多个地点 —— 那么虽然你不知道奖励在左边还是右边,你也应该向右,因为你会有更多选项。
选项的好处是可用可不用。这边有奖励你就可以拿上,没有奖励你可以放过,你只有权益而没有义务。能耐寻求定理的意思就是如果此刻你没看见具体的奖励在哪,那你就往能增加选项的方向 走。
咱们想想,人不也是这样吗?说一个人有“能耐”,比如掌握一项技能、拥有某种资源、能让别人信任自己,这些本身都不会立即带来奖励,但都是在增加选项。你能做别人做不了的事儿,这就 是能耐。
最妙的是,能耐是可以直接寻求的。
✵
其实寻求能耐是人的本性。
我们经常说要「赋能」,而信息论早就有个概念就叫「赋能(empowerment)」[7],意思是增加未来状态的信道容量。说白了就是如果这个动作能让你到达一个地方,那个地方通向更多不同的 未来,这个动作就是赋能。
赋能不是为了取得什么奖励而去做的具体任务,所以你不是被驱使。
2014年,英国赫特福德郡大学(University of Hertfordshire)的AI研究者克里斯托夫·萨尔格(Christoph Salge)提出「行为赋能假说(Behavioral Empowerment Hypothesis)」[8],说赋能是生物体最原始的内驱力:即使不给什么外部目标,生物体仍然会倾向于有所行动,因为它要给自己赋能,它要最大化自己对未来的影响力和选择权。
就算此刻并不饿,细菌也会朝资源更丰富的地方移动,因为那里取得食物的选项更多。如果当前的日子不错,动物会主动探索新环境,因为可能带来更多的交配机会。
为什么人向往自由?因为自由就是更多的选择权。追求自由就是赋能。
✵
工具人说:“我完成了KPI。”
君子说:“我提升了把新问题转化为可解问题的能力。”
同样一个事实,前者的叙事是被驱使,后者的叙事是赋能。君子不器就是你不是在做任务,你是在完善自我。
特定的工具只能做特定的事儿,而人却可以随时扩展自己使用各种工具的能力和选项。这就叫「君子生非异也,善假于物也。」
哪怕眼前没有奖励,我们也要主动探索,因为我们要赋能。君子不是不优化也不是不重视目标函数,而是把目标函数当做手段,自己专注于建立能扩展能力增加选项的系统。君子不器不是反对 专业,而是反对把专业当做身份认同的执念。
学习新知识是赋能,发展新爱好是赋能,进入新领域是赋能,建立良好社会关系是赋能,提升德行是赋能……这些都能给你增加选项。很多事物是副产品,但只要抓住“增加选项”这个根本,赋能 就是可以直接追求的。
能耐寻求定理说君子不器是奖励不确定的环境中的最佳成长策略:你不要优化某个单一目标函数,你要增加选项。
【应用场景】
可能有人说,我现在就是很贫困啊,我就是个打工的,我必须听人指挥,我能怎么办呢?我对此的回答是人家《活出生命的意义》的作者维克多·弗兰克(Viktor Frankl)在纳粹集中营里都能 找到精神自由,你怎么就不能给自己增加选项呢?理解能耐寻求定理,你完全可以 ——
在决策的时候多考虑一个选项,而不是陷入旧叙事的路径依赖;
在身份认同上多一个角色,而不被固定角色绑架;
学习学的不只是某个具体工具,更是提升跨任务的理解力,让能力可迁移;
在社会关系中保持独立性,避免完全依附于单点权力源;
拓展精神空间,以期在不确定性中保持创造性……
就算是赚钱,如果这笔收入能让你的选项变多,那就值得争取;但如果拿这笔钱的代价是让你受制于人、自由减少,那它不是赋能,而是失能。
庄子说我宁可做个在泥巴里自由打滚的活乌龟也不做庙堂上的死乌龟,陶渊明说不为五斗米折腰,李白说安能摧眉折腰事权贵。其实他们不是想做道德楷模,而是凭直觉感悟到了能耐寻求定理 。
注释
[1] 塞德希尔·穆来纳森 / 埃尔德·沙菲尔,《稀缺:我们是如何陷入贫穷与忙碌的》(Scarcity: Why Having Too Little Means So Much),中文版 2014。
[2] Mani, Anandi, Sendhil Mullainathan, Eldar Shafir, and Jiaying Zhao. “Poverty Impedes Cognitive Function.” Science 341, no. 6149 (2013): 976–980.
[3] Haden, Jeff. “Elon Musk Says Living a Happy, Successful, and Meaningful Life Comes Down to 4 Simple Things.” Inc. (Expert Opinion), September 15, 2023. https://www.inc.com/jeff-haden/elon-musk-says-living-a-happy-successful-meaningful-life-comes-down-to-4-simple-things.html.
[4] Sone, Toshimasa, Naoki Nakaya, Kaori Ohmori, et al. “Sense of Life Worth Living (Ikigai) and Mortality in Japan: Ohsaki Study.” Psychosomatic Medicine 70, no. 6 (2008): 709–15.
[5] Kay, John. Obliquity: Why Our Goals Are Best Achieved Indirectly. Penguin, 2011.
[6] Turner, Alexander M., Logan Smith, Rohin Shah, Andrew Critch, and Prasad Tadepalli. “Optimal Policies Tend to Seek Power.” NeurIPS 2021 (Proceedings), 2021.
[7] Klyubin, Alexander S., Daniel Polani, and Chrystopher L. Nehaniv. “Empowerment: A Universal Agent-Centric Measure of Control.” In IEEE Congress on Evolutionary Computation, vol. 1, 128–35. Edinburgh, 2005.
[8] Salge, Christoph, Cornelius Glackin, and Daniel Polani. “Empowerment–an introduction.” Guided Self-Organization: Inception. Springer, Berlin, Heidelberg, 2014. 67-114.