Skip to main content

内核:你的三个“自我”

·1 min

006_内核_你的三个“自我” #

现代人应该了解的世界基本设定也许不可尽数,但最终都会归结到人。

我们想了解人是因为我们渴望成为更好的人。当你因为一时冲动而后悔的时候,当你感到能力不足的时候,当你羡慕别人那种更高境界的时候,你都在思考同一个问题 —— 我怎么才能变得更好?

你肯定可以变。无数的书都告诉你人脑哪怕到了中老年都还有可塑性,你总可以学习新技能新知识,为此你需要有「成长思维模式」等等……但我这里想说一点更深的洞见。

好消息是我们生活在 AI 高速进步的时代。研究 AI 能让我们更加深刻地认识自己,因为人脑本质上也是一个神经网络:如果 AI 的神经网络有这么个性质,人脑很可能也有。

当代神经科学家和哲学家最关心的问题是“意识到底是什么?”“自我是怎么回事儿?”“AI 可以有人的意识吗?”他们把人脑和 AI 类比,有很多收获,我们在《精英日课》 专栏里也讲过很多。我自己跟 GPT 不断讨论这些问题,也有所得。

我们把现代学者的理论和古代先贤的看法摊在一起,聊出一个相对简单但特别好用的工作模型 ——

人有三个自我:进程自我、界面自我和内核自我。

「进程自我(Process Self)」,就是你时时刻刻直观感觉到的那个“我”。

此刻是“我”在阅读。前方有个障碍物,走过去要小心一点,别碰到“我”。“我”在这里,“手机”在我手里。“我”在思考,“别人”在喧哗。

进程自我区分了“我”和“非我”。它是你在这个世界上连续存在的那个主观感觉。

你可能觉得这就是最真实的“我”,但在哲学家看来,这个“我”只不过是个人为创造的方便概念罢了。我是一堆原子,桌子也是一堆原子,为了把这些原子分开叙述,我们才创造了“我”和“桌子”这两个概念。

进程自我是大脑维持“这里有个主体”的那套在线计算。它不只是你的语言和行为,还包括从输入到输出之间的整条运算链。我们说这个宇宙的第一性原理是叙事,人的意识来自于叙事,那么进程自我就是你每次叙事时临时出现的角色。

这个角色的存在感很不稳定,当你全神贯注打游戏的时候,你会忘记“我”的存在。但它的确时刻都在运行。比如面对一个什么刺激,你心率上升、呼吸变浅、语气变硬,那么不管你愿不愿意承认,你的进程自我正在呈现“生气”。

佛学中的「五蕴」—— 色、受、想、行、识 —— 大约可以看成是进程自我的细分模块:感觉输入、情绪评估、概念加工、意向和行动、觉知。这些念头让你生机勃勃,但是 你注意到没有?进程自我其实是个被动的存在。科学家用多个实验证明在人意识到自己的一个决定之前,大脑其实已经做出决定了,中间有几百毫秒的延迟。

换句话说,进程自我只是个新闻发言人而不是实际决策者。它就像是系统运行时的日志(Log),只记录不控制。这就是所谓「五蕴皆空」。

有时候你想到自己:“刚才那句话是不是说重了?”、“我为什么又拖延了?”、“我今天有点焦虑”,以为这就算反思,其实不过是查看运行日志而已,还远没碰到决定长期命运的东西。

「界面自我(Interface Self)」,则是你叙事中更稳定、更可控并且能被别人观察和认可的角色。简单说就是你的性格标签、人设、自传和心情叙事。

界面自我很接近哲学家丹尼尔·丹内特(Daniel Dennett)说的「叙事重心(Center of Narrative Gravity)」[1]。他说大脑里并没有一个小人儿坐在控制室里指挥你的 手脚 —— 你想象中那个野心勃勃的自我,只是大脑为了讲通一个故事而虚构出来的主角,是你人生叙事的重心。界面自我跟进程自我的区别在于它是个连续的故事:“我”今天早上起床,“我”去上班,“我”取得重要成果,“我”将会升职加薪。

界面自我让你和别人迅速知道你是谁。我社恐,所以今晚聚会就不去了。我是个好家长,我很关心孩子的学业。我从小就在努力为这一天做准备。最近的我有点迷茫,但我必须坚强。

你在朋友圈发的小作文、你在面试时的自我介绍、你跟朋友吐槽“我就这样的人”,这些都是界面自我。

界面自我具有一定的因果力,它可以约束进程自我。可能你平时内向,但如果你要求自己“我今天就要扮演一个社牛角色”,你就可以表现得很外向。

但界面自我仍然是变量,而不是常量。

比如你在老板面前是个唯唯诺诺的下属,转头面对餐厅服务员就变成了一个不耐烦的顾客,回到家看见孩子,你又变成了一个慈爱但啰嗦的父亲。请问哪个才是真正的你?

似乎都是,其实都不是。现代心理学认为人的性格并不是固定的,会受到具体情境(context)的强烈影响 [2]。你扮演的那些角色,只是你在不同社交情境下调用的不同“皮肤”或者说“接口”。

界面自我只是你放在前端的用户界面而已。换个应用场景,你的界面马上可以改。

但你还是那个你。有时候你跟人吵了一架,事后连你自己都有点惊讶:“我平时挺温和的啊,怎么会说出那么难听的话?刚才那个人是我吗?”

界面自我不是真正的我。

如果进程自我和界面自我都是生成的,那到底是谁在背后负责生成呢?也许那才是真正的你。我们把它称为「内核自我(Core Self)」。

我大胆猜想,人能感觉到的只有进程自我和界面自我,内核自我是不可被“自我”感知的 —— 因为它就是那个在背后生成感知的东西。

我们前面提到神经科学家卡尔·弗里斯顿(Karl Friston)的「自由能原理」,说大脑是一台预测机器。认知科学家安迪·克拉克(Andy Clark)有个相似的理论叫「预测加工(predictive processing)」 [3],说大脑根据过去的经验,对世界构建了一个预测模型。你在环境中跟各种事物互动,都是先根据自己的预测去观察和行动,然后看 看行动的结果代表预测正确还是错误;如果预测错误,就可以修改模型。

比如你推开家门,预测灯的开关在右手边,一摸摸空了,于是去左边找 —— 这就是在更新模型。

到底是谁在预测呢?就是你的内核自我。

面前出了这么个状况,你为什么预测局面将会往这个方向而不是那个方向转变?内核自我是一套庞大的、复杂的、甚至是无意识的概率分布和「先验假设(Priors)」 ——

为什么别人听说那个消息觉得是机会,你却觉得是骗局?因为你的先验假设不同。为什么有人遇到挫折是战斗或逃跑反应,有人却是习得性无助?因为底层的反应模式不同。

这些东西不随你今天的心情而变,也不随你是在老板还是在家人面前而变。内核自我是你的出厂设置加上历史数据的总和,虽然不是绝对的常量,但也是慢变量。它藏得最深,平时不说话,但它决定了你所有的直觉、冲动和潜意识判断。

《金刚经》和现代哲学都认为并没有一个单一的、恒定的实体叫“我”。但如果非要找一个最接近“真我”的,那就是内核自我这套算法和参数。

你是谁,从根本上,是“你这台机器一般会如何预测世界、如何更新自己”的那套默认代码。内核自我是不容易改、却持续影响你行为倾向的模型参数和更新规则。

也许内核自我就是佛学说的「阿赖耶识」,它的成分是「习气」和「业力」。

咱们跟 AI 做一番类比你就更容易理解了 ——

进程自我,也就是你当下的念头流,就相当于大语言模型(LLM)在当前这次运行中的输入、思考和输出。你给 ChatGPT 输一句话,它在内部层层传播、算注意力、采样 token,最后回复你,这一整条流就是进程自我。

界面自我,也就是你应对情境的面具,则相当于是模型的系统提示词和角色设定。你让 ChatGPT 扮演一个比如说毒舌投资人,它会照办,但你这个指令不会改变它自身。

内核自我,则是模型的结构和参数,或者叫「权重(Weights)」。当前主流大模型一旦训练好、发布了,权重就冻结了,所以这才是模型的真我。

如果你是一个 AI,那么当你在外界刺激之下做出反应的时候,你改变的只是进程自我;当你说“等会儿我要去见领导,得稳重点”的时候,你是在给界面自我临时写提示词 。有时候提示词写得好,平庸的模型也能表现得像个专家。但那只是激活,不是能力提升:一旦遇到高压环境,人设就会崩塌,把局面终究交给内核自我。

绝大多数人在一生的绝大多数时间都只不过是对刺激做出反应和改改提示词而已。有时候为了维护人设,你反而会压抑真实过程,让内核自我变得更僵硬 —— 明明可以承认自己不懂,可你非得假装懂,那怎么能更新模型呢?

真正的成长必须改写模型参数。

如何升级内核自我?我们可以从 AI 模型训练中获得启示。模型的结构是先天设定,就如同人不能长两个脑袋一样,所以咱们单论参数。人明显比现在的 AI 强的一个地方就是我们的参数是活的,可以在生活中持续训练改变。但我们的训练方法跟 AI 差不多,因为毕竟都是神经网络。

你不太可能听完一篇文章就瞬间变成一个新人。参数都是肉长的,得慢慢调。微调参数的杠杆有两个:一个是预训练的语料,一个是强化学习的奖励函数。

语料是你训练的样本,说白了就是你从小到大看听的故事、模仿的行为、加入的群体。短视频训练你对什么上瘾;公众号和书训练你对什么敏感;你身边的正常人是什么样,训练你的价值观。

所谓「近朱者赤,近墨者黑」,翻译成现代语言就是信息输入训练神经网络参数。如果你每天摄入的信息都是情绪化的、碎片的、极端的,你就会变得急躁、浅薄、二极管思维。你的大脑参数被调整成适应那种信息的模式。工程师会说:你的神经网络过度拟合(overfitting)了垃圾数据。

奖励函数,就是给你的行为提供反馈的那个奖惩机制,说白了就是什么东西在给你做的事情打分。如果你的奖励函数是“老板看了要夸我”,你就会本能地往报告里塞漂亮话,你会淡化问题;而如果你的奖励函数是“帮团队少踩一个坑”,你就会愿意把难看的数字摊开,把失误写清楚。假以时日,这两个奖励函数会把你训练成完全不同的两种人。

你的伴侣、你的朋友圈、你所在公司的文化都在书写你的奖励函数,要小心选择他们。

一个洞见是奖励函数得明确具体才好用。什么叫“写得好”?什么叫“领导力”?什么叫“健康生活”?泛泛而谈没意义。目标必须具体才可执行:是语文老师说的那种好叫写得好,还是放在网上引发读者热议转发才叫写得好?

强化什么,你就会成为什么。

而在所有那些之前,你要让自己的神经网络处于可更新状态才好。在现实中受挫了,你是直接来一句“这个世界不公平”了事,还是修改自己的模型呢?自由能原理认为当一个人面对预测误差,所谓被现实“打脸”的时候,他有三个选择来最小化惊讶 ——

  • 最偷懒的做法,是改注意力:干脆别看打脸的证据;

  • 稍好一点,是改行为:以后绕过类似场景;

  • 最难但最值钱的,是改模型:承认“原来我是错的”,重写参数。

被现实打脸,本应该是内核自我更新的黄金时机。

说到这里,人毕竟比现有的 AI 高了一层:人可以自行选择自己的训练样本和奖励函数,而 AI 不可以。我估计就算有一天 AI 想要自己选,我们也不会允许它选,那太危险了。

所以能选择成为一个什么人,可以说是人的终极自由。

这是最根本的「元认知」:你永远都可以抬头看一眼 —— 是谁在训练我?我为什么要往那个方向变?凭什么这个就是好的、那个就是不好的?

中国人说「吾日三省吾身」,还说「苟日新,日日新,又日新」,现在听起来都很有极客精神:这不就是要随时接受反馈、持续交付人生的新版本吗?

西方也有段谚语值得反复回味 ——

当心你的思想,它们会成为语言;

当心你的语言,它们会成为行动;

当心你的行动,它们会成为习惯;

当心你的习惯,它们会成为性格;

当心你的性格,它会成为你的命运。

以我们这一讲的框架来说,思想、语言和行动就是进程自我的在线流动;习惯和性格是你展示出来的界面自我 —— 它们都在默默改写内核自我的参数,凝聚业力。

有了这些基本认识,我们就可以学习各种思维工具了。

注释

[1] Dennett, Daniel C. “The Self as a Center of Narrative Gravity.” In Self and Consciousness: Multiple Perspectives, edited by Frank Kessel, P. Cole, and D. Johnson. Hillsdale, NJ: Erlbaum, 1992.

[2] 性格……到底是什么意思?

[3] Clark, Andy. Surfing Uncertainty: Prediction, Action, and the Embodied Mind. Oxford: Oxford University Press, 2016.