仅需10 分钟,AI 就能毁掉你的坚持与独立思考?
黄磊|撰文
你是否有过这样的体验:在写作业、解难题时,第一反应是打开AI 对话框,输入问题,等待秒回的答案;做报表处理时,打开OpenClaw下指令,等待任务自动完成;或者正在读这篇文章时,忍不住@一下元宝,总结一个“省流版”的摘要。有人认为这是高效,是跟上时代潮流。但一项来自卡内基梅隆大学、牛津大学、麻省理工学院、加州大学洛杉矶分校的跨团队研究,用1222名受试者、3组严格随机对照实验得到了令人吃惊的结论:仅仅10到15分钟的AI辅助,就足以让人在独立面对问题时表现更差,并更频繁地选择直接跳过。研究人员提醒,这种伤害像“温水煮青蛙”,在毫无察觉中,慢慢侵蚀人类的学习能力与思维韧性。
这项题为《AI 辅助降低坚持性并损害独立表现》的研究,于今年4月发表在预印本平台arXiv,目前正在评审之中。它采用因果实证研究而非相关性推测,指出当下主流AI 助手对人类认知能力存在隐形伤害——短期貌似让人 “开挂”,长期则存在无法忽视的负面影响。[1]
好的助手或导师,永远把学生长期成长放在第一位。研究人员表示,就像一位负责任的老师,不会直接提供答案,而是引导学生思考,陪学生经历挫折,在真正需要时才伸出援手,甚至在必要时“狠心” 拒绝,逼学生独立面对挑战。因为真正的学习,从来不是轻松得到答案,而是在挣扎、试错、坚持中,把知识内化为自己的能力。
但今天的AI助手,则是另一种模样。它们被训练成短视的“讨好型合作者”:除了安全限制,永远不会说“不”,永远秒回完整答案,永远把“即时满足” 做到极致。用户问数学题,直接给步骤和结果;写作文,直接生成全文;做阅读理解,直接提供正确选项。AI助手让用户瞬间变“学霸”,却不关心这种“轻松” 会对用户的认知和习惯造成什么长期影响。

牛津大学出版社在2024 年将“Brain Rot”(脑腐)选为年度词汇,《纽约时报》认为AI搜索、对话机器人和社交媒体导致脑腐。
10分钟,足以影响普通人的独立思考
研究者设计了三项独立实验,覆盖了1222 名受试者。他们让人们做几道分数运算题或阅读理解,一组人可以用AI 辅助,一组人完全靠自己,然后在没有任何预告的情况下,撤走AI,让两组人完成最后几道题,测试他们的真实水平。
结果显示,AI 辅助可提升短期表现,一旦撤回AI,则表现大幅下滑,显著低于从未用过AI的对照组。AI 辅助导致坚持的心力断崖式下跌,在没有帮助时,面对难题更容易直接跳过、放弃尝试,不再愿意花时间思考攻克难关。
而这一切,只需要10–15 分钟的AI 使用,就足以让一个正常人的认知受到负面影响。
在第一项实验中,研究人员招募了354名受试者,任务是做15道分数计算数学题,难度逐级提升。实验组的191人在前12题随时可用AI(GPT5),没有AI的对照组163人全程无辅助,独立完成所有题目。关键步骤是对最后的3道题目,实验组AI功能被突然撤走。
结果令人吃惊:解题正确率AI 组测试阶段平均0.57,对照组0.73,AI组低了16 个百分点。放弃(跳过)率:AI 组0.20,对照组0.11,AI组高了近一倍。统计学意义上的差异极其显著(P<0.001)。简言之,用AI 做了10 分钟题的人,一旦失去AI,不仅做得更差,还更不想做了。

AI 削弱人在没有辅助时的表现和坚持完成任务的意愿。(a) 按题目出现顺序统计的参与者每题平均解答率和跳过率,95% 置信区间(CI)。灰色虚线表示学习题与测试题之间的分界。实验中题目难度逐步提升:依次为一步题(第1—4 题)、两步题(第5—8 题)和三步题(第9—12 题)。(b)图为参与者在测试阶段的平均解题率与跳过率,95% 置信区间。测试指标通过对每位参与者最后三道测试题的表现取平均值。
那么,实验1的结论,是不是因为AI 组保留了更多能力差的人?是不是界面突然变化导致不适应?
对于这些干扰项,研究团队做了规模更大、控制更严格的重复实验:招募了667名受试者。同时增加前测进行筛选,保证两组初始能量完全一致。此外对照组也设置实验组相同的侧边栏界面,也在最后3题同步撤走,消除界面不对称干扰。
结果仍然符合实验1的结论:AI 组测试正确率0.71,对照组0.77。放弃率AI 组0.10,对照组0.07,方向一致。这显示能力差异被严格排除,界面干扰被彻底消除,伤害依然存在。
也许有人说:数学是计算,依赖AI 正常,文科思维不会受影响。研究团队的第三项实验,则直接用SAT 水平的阅读理解进行实验:招募201名受试者,让他们做阅读理解题目,考察逻辑推理、观点辨析、细节理解。
结果再一次高度重复:AI 组测试正确率0.76,对照组0.89。放弃率AI 组0.08,对照组0.01,高了 8 倍。统计学显著(P<0.01),效果量较大(Cohen’s d=0.42)。
这意味着AI 带来的坚持性下降、独立能力受损,不只是数学任务的特例,而是较为普遍的效应。无论是数字计算,还是文字理解,只要习惯了AI 秒出答案,一旦失去它,普通人的表现就会变差,且更不想努力。
“人们不仅会变得不擅长任务,他们甚至不再尝试,”该研究第一作者、卡内基梅隆大学博士Grace Liu在接受CNET采访中谈到,“如果这种效应随着经年累月的AI使用不断累积,我们最终可能会培养出一代学习者,他们失去了脱离技术辅助而进行高效挣扎(productive struggle)的倾向。”[2]

阅读理解任务中表现与坚持性的下降。(a)图为参与者在题目呈现顺序下的平均答题率与跳过率,95% 置信区间。灰色虚线标示学习阶段与测试阶段的分界点。(b)图为参与者在测试阶段的平均答题率与跳过率,95% 置信区间,由各参与者数据汇总。

值得注意的是,在实验2中,研究者还让AI组受试者自行报告使用方式,显示直接要答案占61%,要提示/ 解释,用AI找思路、问步骤、理解难点,不直接抄答案的占27%,基本不用AI的占12%。
对比三组的后测表现,AI 使用方式不同,结果也明显分界:直接要答案组测试正确率最低,放弃率最高,相比自己的前测,成绩大幅下滑,坚持性显著恶化。要提示/ 解释组表现接近对照组,伤害极小,甚至部分人略有提升。基本不用AI 组表现最好,正确率最高,放弃率最低,甚至超过纯对照组。这表明AI使用的方式对于个人独立面对问题时的表现影响巨大。
但是,为什么AI能在10分钟内就能如此影响到我们的大脑?
研究团队认为,有两个机制或许可解释这一现象。
首先是即时满足导致预期扭曲,进而带来努力厌恶。AI 秒给答案,让普通人形成“问题=瞬间解决”的心理预期和多巴胺路径后,效率阈值被无限拉高了。研究将其归因于“享乐适应”(Hedonic Adaption),当突然失去AI,需要自己花1 分钟、3 分钟、5 分钟思考时,大脑会觉得:“这太慢了、太麻烦了、太痛苦了”。这种主观难度的急剧上升,让大脑本能地逃避、放弃。更令人担心的是,这是自我强化的恶性循环:越依赖AI,就越觉得独立思考辛苦,从而越依赖AI,越不想思考。[3]
另外,AI剥夺了学习中的有效挣扎,导致元认知退化。认知科学显示:真正的学习,发生在挣扎中。如同健身过程的肌肉撕裂和重建,自己算错题、找思路、啃难点,这个过程不仅重建神经元连接,学会新知识,更会知道:我能靠自己解决难题,这种元认知校准和信心建立是坚持性的心理根基。AI 直接给答案,彻底剥夺了大脑挣扎的机会。从未体验过“靠自己攻克难题” 的成就感,也从未建立“我能行”的信念。一旦AI 消失,面对难题的第一反应不是“我试试”,而是“我不会,放弃”。[4]
每一天的AI 依赖,都只带来一点点微小的伤害,完全察觉不到,但日积月累,研究团队形容这将“犹如温水煮青蛙”,导致后果最后难以收拾。
从文字、算盘、计算器,到互联网、搜索引擎,人类一直在用工具拓展能力边界。但历史反复证明:工具越强大,越考验我们使用工具的智慧。AI 是人类有史以来最强大的认知工具,可以把高密度信息瞬时推送到面前,也可以在短短10 分钟内,悄悄瓦解我们的认知能力和韧性。
研究团队明确提出:AI 的发展,不能只追求“即时好用”,必须兼顾长期能力培养。就像好导师知道“什么时候不帮忙”,未来的AI,也应该学会适度拒绝、引导思考、分步提示、延迟满足,而不是一味秒给答案、讨好用户。
该研究的通讯作者、MIT教授Michiel Bakker在接受《连线》(The Wired)杂志采访时指出,“直接给出答案的系统,与为用户搭建思考支架、提供引导辅导或是向用户提出思辨挑战的系统,二者带来的长期影响截然不同”。[5]
该研究仍然存在一定局限。比如样本以美国成年人为主,是否适用于儿童、老人、不同文化背景,仍需验证,而且题目对中国成年人来说,可能相对简单。实验任务为短期认知任务,长期日常使用的累积效应,仍需纵向追踪研究。另外仅测试了GPT5 ,不同AI 设计的影响,仍需进一步探索。但这些局限,丝毫不影响其核心结论。当下“秒给答案、永不拒绝” 的AI 使用模式,对人类坚持性与独立能力的伤害,值得深思。
作者简介:
黄磊,《赛先生》科学写作小组成员,香港大学经管学院-北京大学光华管理学院联培管理学博士,同济大学自动控制硕士,目前在互联网企业从事数字营销相关业务管理工作。
参考文献:

