认知负荷理论:为什么“差生文具多”是一个科学真理?

Table of Contents
笔记本寓言:硬件问题还是神经处理? #

想象你是一个发展中国家的教育部长,手里突然多了一大笔预算。你决心用这笔钱提升边远地区孩子的学习水平。你应该怎么做呢?
秘鲁政府的做法是给孩子买电脑。他们在农村推行了“每个孩子一台笔记本电脑”(One Laptop per Child)项目。电脑是现代世界的生产力标配,穷人家孩子用不起,现在政府免费送你,这多好呢?
但是有的学者不这么看。电脑好是好,但它对学习真有帮助吗?
其实秘鲁这个项目是一个大规模教育实验的一部分。2006—2012 年间,拉丁美洲 and 加勒比地区的 20 个国家总共发放了将近一千万台笔记本电脑。经济学家 and 教育学家就此进行了超过十年的大规模随机对照跟踪研究。
2025 年,答案揭晓 [1]:不论是短期还是长期,发电脑对孩子们的学业成绩都没有任何显著的正面影响,收到电脑的学生的数学和阅读成绩都没有改善 —— 他们按时升年级的比例不但没有上升,反而平均下降了一个百分点。
这个研究中电脑让孩子唯一提高的技能,就是操作电脑的技能。
我觉得这简直是个现代寓言。买电脑这个动作特别像我们的学校和家长对教育的理解:你认为学习是一个宏观问题,甚至是一个硬件问题。孩子学习不好怎么办?我花钱啊!上补习班,送去更好的学校,升级学习环境,提供更好的设备,再多买点文具啥的……花钱了,我就安心了。
但学习其实是个微观问题。
学习是个神经重塑过程。你必须深入到神经处理层面去考虑问题:当一个孩子坐在书桌前,那个叫“知识”的东西,到底是怎么钻进他大脑里的?
什么是认知负荷理论? #
作为「教育与学习」板块的第一讲,咱们说说现代教育心理学中最硬核、也最具有工程学美感的一个心智模型,叫「认知负荷理论(Cognitive Load Theory,简称 CLT)」。
我敢打赌,绝大多数老师,包括一些号称教育专家的人都没听说过认知负荷理论。但这可是教师和家长需要了解的唯一最重要的理论。
理解了这个理论,你就知道为什么大多数教育操作都是瞎胡搞了。
✵
认知负荷理论最早是澳大利亚教育心理学家约翰·斯韦勒(John Sweller)在 1980 年代提出来的 [2],现在经过他本人和众多学者不断完善,被用到很多地方。
大脑的内存与硬盘 #

斯韦勒的问题是:如果一个人学习总学不进去,所谓“脑子不够用”,你说这是因为他大脑的硬盘不行,还是内存不行?
首先硬盘是不可能有问题的。人脑「长期记忆(long-term memory)」的容量几乎是无限大的。你读多少本书、记多少个单词、掌握多少个技能、经历过多少事、看过多少电影,都不用担心硬盘装不下。
学习新东西的瓶颈,主要是在内存上。所谓内存就是大脑的「工作记忆(working memory)」,它的带宽极其有限,一般认为普通人最多只能同时处理 4 到 7 个信息元素。就这点信息,你要是不及时写入硬盘,它们就会被你忘记。
学习的本质,就是把外部的零散信息,在狭窄的工作记忆里进行加工,然后打包存入长期记忆。
认知负荷的三种类型 #

认知负荷理论的核心洞见是:学习失败并不是因为大脑的硬盘存不下,而是因为新信息通过工作记忆这道窄门的时候,堵车了。
当信息涌入大脑时,工作记忆所承受的总压力,就叫「认知负荷(Cognitive Load)」。它一般被分为三种 ——
「内在负荷(intrinsic load)」,是学习材料自带的复杂度,也就是当前任务中有多少元素必须同时联动处理。
「外在负荷(extraneous load)」,是那些跟当前任务无关的信息在强行抢戏,给大脑制造的负荷。这里可能有环境噪声、有无关的内容,还包括老师糟糕的讲法带来的困扰。
「增益负荷(germane load)」,有时候翻译成“生发负荷”,是指大脑把知识转化为长期记忆的那部分有效努力,也就是你的大脑一边压制外在负荷,一边操作内在负荷,真正干活儿的那股劲儿。
现在更新的认识,包括斯韦勒本人 2023 年的论文 [3],认为没有必要把「增益负荷」单独算作一类。我们简单说,要想学习有效,就得尽可能减少外在负荷,把带宽留给内在负荷。
这你就理解了为什么给孩子买电脑不能提高学习成绩:电脑是个分散注意力的东西,它增加了「外在负荷」。
那到底为什么有的孩子学东西特别快,有的孩子就学不进去呢?难道是他们的工作记忆大小不同吗?也不是。人的工作记忆差距并不大。认知负荷理论还有一个特别关键的概念,叫「图式」。
图式:大脑的压缩包 #

✵
这个重要的洞见是:大脑的长期记忆里存的那些“知识”,并不是零散的信息碎片,而是一种叫做「图式(schema)」的东西 [4]。
图式是把多个相关元素打包成一个整体的认知结构,你可以把它理解成“知识组块”或者“思维宏(macro)”,或者说是个“压缩包”。
比如说,在刚学认字的小孩眼中,“中”、“华”、“人”、“民”、“共”、“和”、“国”是 7 个独立的元素,这么多字一起出现在他面前,瞬间就能占满他的工作记忆带宽;但对于你来说,这 7 个字早就被打包成了一个叫“中华人民共和国”的单一图式。它在你眼中只占用 1 个内存槽位。
为什么差生学不进去,优等生一看就明白?因为差生头脑里没有足够多的图式,他看到的是一大堆碎片化的信息,导致他的认知负荷太高了;而优等生因为早就拥有相关的图式,同样的信息在他眼中是一大块一大块的,他处理的元素就比较少,就不会出现认知过载。
比如老师在黑板上写一道方程:
3(x+2)=15
优等生脑子里已经有“分配律”、“移项”等等的图式,他看见题就会自动调用那些图式求解,甚至还觉得挺无聊。
可是差生没有那些图式,他看到的是一个个单独的元素。这些元素瞬间塞满了他的工作记忆:括号是什么意思来着?要把 3 乘进去吗?还是先把 2 减掉? 他的内在负荷已经过载。
所以在认知负荷理论看来,一份材料到底有多难,不取决于它客观上有多少信息,而取决于它在你脑子里算是多少信息:你有相关的图式,它的信息量就很少;而如果你图式不够,它的信息量就会很多,导致你认知过载。
换句话说,优等生学得快不是因为脑子更快或者更大,而是因为脑子里的压缩包更多。
这也可以说是学习的复利效应:你会的图式越多,学习新东西就快;正如你读过的书越多,你读书的速度就越快。
由此说来,学习不是把知识一条条搬进脑子,而是脑子压缩和调用图式的过程。
“差生文具多”的科学解释 #

✵
为什么民间有个说法叫“差生文具多”呢?
这位同学本来会的图式就少,所以内在负荷过载 -> 老师又讲得不清楚,甚至还胡乱加戏,在黑板上用五颜六色的粉笔画可爱的人物提供外在负荷,说这回你懂了吗?→ 爸爸一看怎么还学不明白,一通大吵大闹,继续追加外在负荷 → 妈妈说孩子需要帮助,于是给买了一大堆花里胡哨的荧光笔、错题本和便利贴 → 这些文具提供了虚假的控制感,孩子于是用三种颜色在课本上画出重点,仿佛这样就能让知识进入脑子……
你说这还怎么学习。
可以说正是因为干扰因素太多,差生才是“差生”。
真正的学习 requires 清爽的信息环境 —— 有效的教学最好把外在负荷全部取消,应该用最简单的讲解尽可能降低内在负荷,应该是给工作记忆减负、给长期记忆铺路。
在这个视角下,我看很多课堂根本就不是在教学,是在搞行为艺术,在给家长提供情绪价值。
我做了一番调研,从认知负荷理论中提炼出四个有效教学的心法。
心法一:管理内在负荷 #

✵
第一个心法是管理内在负荷。
面对差生,老师本能的想法是降低难度 —— 但这里不是难度的问题,而是带宽的问题。有效教学不能是把山峰给孩子削平,而是要给孩子建立攀登高峰的梯子,也就是精心安排图式进入大脑的进度。
如果学生脑子里还没有足够的相关图式,你就别一上来就让他做综合大题。你必须先把复杂知识拆解成一个个小图式让他先练会了再说。
内容要分段,前置知识要预热,部件要先自动化,先给局部结构,再整合 [5]。让学生站稳一个台阶,再给他看下一层。
人们常说差生的问题在于基本功,其实就是之前的图式没有打牢。图式才是根本。
有效教学不是降难度,而是排兵布阵。
心法二:直接教学的力量 #

✵
第二个心法是给「直接教学(Direct Instruction)」。
过去几十年间,教育界流行一种可以说非常浪漫的“探索式学习”,主张老师不要直接给答案,要让孩子在真实情境中自己摸索、自主发现规律。可是有大量研究一再证明,这种把孩子当科学家的教法,效率极低 [6]。
因为认知负荷太高了。
你给新手一道题让他自己探索,他的大脑要同时干很多事:盯住题目、猜目标、搜索步骤、试错、比较当前状态和目标状态、还得揣摩老师到底想让他学什么。他的内存都消耗在搜索路径上了,哪还有剩余算力去总结规律呢?
其实对于学校里那些知识来说,最有效的教学方法就是直接教、给明确的(explicit)指导。
研究证明最高效的教法是「范例学习」(worked-example)[7]:黑板上左边是一道老师给出完整解题步骤的例题,右边是一道结构完全一致、只是数字不同的练习题。让学生照着例题做练习题,就这么简单粗暴。这就是把图式写入大脑最快的方式。
等到学生把这个图式掌握熟练了,你再给他灵活度,逐步走向独立。这个过程叫「指导淡出(guidance fading)」。
不是不让孩子探索,但教学就是教学。先把搜索成本降下来,才能把理解难度提上去。
心法三:消除外在负荷 #

✵
第三个心法是消除外在负荷。
人们常说学习不好是因为注意力不集中,可你也得创造条件,让人能集中注意力才行。聊天、玩电脑当然是分散注意力的行为,可是家长给买一大堆文具,一会儿送吃的一会儿过来监督一下,不也是在制造外在负荷吗?
在认知负荷理论看来,连老师在课堂上搞的那些戏剧性的多媒体教学手法,常常也是无效且有害的。幻灯片上搞一堆装饰、动画飞来飞去、图在左边解释在右边、老师嘴里讲一句屏幕上再打一遍同样的话、视频不给暂停、作业平台按钮比题目还多 —— 这些都不是教学创新,是认知污染 [8]。
难道学习内容本身还不够学生看的吗?
不要逼着学生的眼睛一会儿看向屏幕左边,一会儿看向屏幕右边。给配图加口头讲解,比图像配上满屏文字效果更好。
老师玩点花活有时候能激发学生的学习兴趣,但花活不是教学。
心法四:因材施教 #

✵
第四个心法是优等生和差生要区别对待。
这不是给人贴标签,更不是说差生脑子差 —— 差生将来也可以成为优等生,但是你现在拥有的图式不够。2025 年的一篇荟萃分析论文 [9] 结论非常清楚:低先验知识学习者更受益于高支持教学,高先验知识学习者更受益于低支持教学。
对差生,老师必须多给显性的提示、多讲例题、多做同样题型的练习、控制好节奏,少跳步、少开放,少自行搜索。
而优等生已经拥有相当多的图式,你就得设法让他们的内在负荷吃饱才行,不然他们会感到无聊。所以对优等生要少重复、快淡出,多给变化题型,多做迁移;给他一定的探索空间。
这样说来,一个班好几十人坐在一起听老师讲是一种效率极低的教育方式。教育应该个人化才好。那我们有什么办法呢?
你可以使用 AI。
AI 的角色:导师还是枪手? #

✵
坏消息是,有好几项研究都发现,AI 在伤害学生的学习能力。现在很多学生把 ChatGPT 当写作业神器(Doer),结果他们在突击测试中的成绩显著下降 [10]。
这是因为学生把原本属于「增益负荷」的建构图式的过程直接外包给了 AI。大脑没有经历过负荷,神经元就没有连接,图式就没有形成。
好消息是,如果你把 AI 的角色严格限制为导师(Tutor) —— 也就是它只负责把复杂知识拆解成小图式、剔除无关的外在负荷、一步步引导你,而不是直接给你答案 —— 使用 AI 的学习效果会高于传统的课堂学习 [11]。
结语:给大脑编程 #
✵
很多人认为学习是一种苦行。但学习其实是个工程问题。教学,就是给大脑编程。
认知负荷理论告诉我们,人的大脑是一个极其受限的生物装置。你不能强行给它灌输什么东西,你必须尊重它的输入带宽,一点一点按照一定的节奏,帮它把知识变成一个个图式。
就算脑机接口将来再发达,我也不太相信人可以直接下载一个什么技能,因为神经元是肉长的。这是有关学习和教育最重要的硬约束。
注释 #
[1] Cueto, Santiago, Diether W. Beuermann, Julian P. Cristia, Ofer Malamud, and Francisco Pardo. 2025. “Laptops in the Long Run: Evidence from the One Laptop per Child Program in Rural Peru.” NBER Working Paper 34495. doi:10.3386/w34495.
[2] Sweller, John. 1988. “Cognitive Load During Problem Solving: Effects on Learning.” Cognitive Science 12 (2): 257–285.
[3] Sweller, John. 2023. “The Development of Cognitive Load Theory: Replication Crises and Incorporation of Other Theories Can Lead to Theory Expansion.” Educational Psychology Review 35 (4): 95.
[4] Sweller, John. 2024. “Cognitive Load Theory and Individual Differences.” Learning and Individual Differences 110: 102423.
[5] Sweller, John. 1994. “Cognitive Load Theory, Learning Difficulty, and Instructional Design.” Learning and Instruction 4 (4): 295–312.
[6] Kirschner, Paul A., John Sweller, and Richard E. Clark. 2006. “Why Minimal Guidance During Instruction Does Not Work.” Educational Psychologist 41 (2): 75–86.
[7] Barbieri, C. A., et al. 2023. “A Meta-analysis of the Worked Examples Effect on Mathematics Performance.” Educational Psychology Review 35: Article 11.
[8] Schroeder, N. L., and A. T. Cenkci. 2018. “Spatial Contiguity and Spatial Split-Attention Effects in Multimedia Learning Environments: A Meta-Analysis.” Educational Psychology Review 30: 679–701; Ginns, Paul. 2005. “Meta-analysis of the Modality Effect.” Learning and Instruction 15 (4): 313–331.
[9] Tetzlaff, Leonard, et al. 2025. “A Cornerstone of Adaptivity: A Meta-analysis of the Expertise Reversal Effect.” Learning and Instruction 98: 102142.
[10] Barcaui, A. 2025. “ChatGPT as a Cognitive Crutch: Evidence from a Randomized Controlled Trial on Knowledge Retention.” Social Sciences & Humanities Open 12: 102287.
[11] Kestin, Greg, Kelly Miller, Anna Klales, Timothy Milbourne, and Gregorio Ponti. 2025. “AI Tutoring Outperforms In-Class Active Learning.” Scientific Reports 15: 17458.