为什么“重赏之下必有勇夫”?《Science》从多巴胺角度给出神经科学解释

2026-05-27 15:56
未知

日常生活里大家都觉得学得好不好,主要靠反复练习,适时的奖励只是次要影响因素。大脑里的多巴胺和收获激励是密切相关的,不少研究也发现奖励多少,真的会改变学习状态!

基于此,2026年5月21日,霍华德·休斯医学研究所Luke T. Coddington研究团队在《Science》杂志发表了“Reward magnitude determines reinforcement learning efficiency”揭示了奖励幅度决定强化学习效率。

本研究发现奖励会借助多巴胺影响学习快慢,调高奖励后,小鼠在各项任务学得更快,少量练习就能熟练掌握任务范式。高额奖励能提升学习速度、记忆力与专注力,刺激多巴胺也能加快学习,但不会巩固所学。

图一 单次奖励大小影响小鼠学习成效

作者检测发现,如果给小鼠奖励水量增加时,多巴胺释放更多、作用更久,和传统饱和模型预判并不一致,高额奖励能让多巴胺长期维持高位。

总奖励总量相同的前提下,单次大额奖励比小额分次奖励,能让小鼠学得更快,即便是更少训练动物就可以掌握技能,学习效率随单次奖励增加呈现稳步上涨,甚至还能缩小个体学习差距。反复训练后奖赏反应会呈现慢慢减弱的趋势,觅食失利时多巴胺水平也会发生短暂下降。

结果发现,高额奖励既能加快行动速度、提升动作稳定性,也不会影响任务准确率。后续即便是下调奖励后,前期高额奖励能力依旧稳固,单次足量奖励就能实现动物对于任务的长效提升。

图二 多巴胺信号强度调控小鼠学习表现

高额奖励能增强、延长脑内伏隔核多巴胺释放,加快学习进度。小额奖励则会易让小鼠松懈,多巴胺反应也随之减弱。

作者在实验中模拟不同强度多巴胺信号后发现,信号越强学习效率越高,还能改善学习差距、提升初期在任务中的行动速度。停止刺激后这种状态稳定,证明是学习能力发生了真正提升。

图三 高额奖励同样助力高难度决策学习

为验证奖励增益能否适配高难度任务,作者选用感知决策实验测试对动物行为评估。作者通过对比常规奖励与穿插高额奖励两组小鼠的表现发现,很明显后者学习效率更高,具体表现在历经大量训练后分辨能力更出色、选择失误更少。

高额奖励还能削弱动物的固有选择偏好,减少其非理性判断。这样带来的好处就是既能让学习速度加快,也能让小鼠全程保持专注,最终表现在任务处理中发挥更稳定。

图四 全文摘要图

总结

研究结果凸显了在计算模型中引入自适应学习率机制的必要性,有助于更准确地模拟生物学习过程,从而弥合理论预测与真实行为之间的差距,对优化人工智能学习算法和深化脑科学机制理解均具有重要价值。

文章来源:

https://doi.org/10.1126/science.aeb0813

原标题:《为什么“重赏之下必有勇夫”?《Science》从多巴胺角度给出神经科学解释》

阅读原文

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。