为什么“重赏之下必有勇夫”？《Science》从多巴胺角度给出神经科学解释

2026-05-27 15:56

未知

日常生活里大家都觉得学得好不好，主要靠反复练习，适时的奖励只是次要影响因素。大脑里的多巴胺和收获激励是密切相关的，不少研究也发现奖励多少，真的会改变学习状态！

基于此，2026年5月21日，霍华德·休斯医学研究所Luke T. Coddington研究团队在《Science》杂志发表了“Reward magnitude determines reinforcement learning efficiency”揭示了奖励幅度决定强化学习效率。

本研究发现奖励会借助多巴胺影响学习快慢，调高奖励后，小鼠在各项任务学得更快，少量练习就能熟练掌握任务范式。高额奖励能提升学习速度、记忆力与专注力，刺激多巴胺也能加快学习，但不会巩固所学。

图一单次奖励大小影响小鼠学习成效

作者检测发现，如果给小鼠奖励水量增加时，多巴胺释放更多、作用更久，和传统饱和模型预判并不一致，高额奖励能让多巴胺长期维持高位。

总奖励总量相同的前提下，单次大额奖励比小额分次奖励，能让小鼠学得更快，即便是更少训练动物就可以掌握技能，学习效率随单次奖励增加呈现稳步上涨，甚至还能缩小个体学习差距。反复训练后奖赏反应会呈现慢慢减弱的趋势，觅食失利时多巴胺水平也会发生短暂下降。

结果发现，高额奖励既能加快行动速度、提升动作稳定性，也不会影响任务准确率。后续即便是下调奖励后，前期高额奖励能力依旧稳固，单次足量奖励就能实现动物对于任务的长效提升。

图二多巴胺信号强度调控小鼠学习表现

高额奖励能增强、延长脑内伏隔核多巴胺释放，加快学习进度。小额奖励则会易让小鼠松懈，多巴胺反应也随之减弱。

作者在实验中模拟不同强度多巴胺信号后发现，信号越强学习效率越高，还能改善学习差距、提升初期在任务中的行动速度。停止刺激后这种状态稳定，证明是学习能力发生了真正提升。

图三高额奖励同样助力高难度决策学习

为验证奖励增益能否适配高难度任务，作者选用感知决策实验测试对动物行为评估。作者通过对比常规奖励与穿插高额奖励两组小鼠的表现发现，很明显后者学习效率更高，具体表现在历经大量训练后分辨能力更出色、选择失误更少。

高额奖励还能削弱动物的固有选择偏好，减少其非理性判断。这样带来的好处就是既能让学习速度加快，也能让小鼠全程保持专注，最终表现在任务处理中发挥更稳定。

图四全文摘要图

总结

研究结果凸显了在计算模型中引入自适应学习率机制的必要性，有助于更准确地模拟生物学习过程，从而弥合理论预测与真实行为之间的差距，对优化人工智能学习算法和深化脑科学机制理解均具有重要价值。

文章来源：

https://doi.org/10.1126/science.aeb0813

原标题：《为什么“重赏之下必有勇夫”？《Science》从多巴胺角度给出神经科学解释》

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。