数据导入
西门子、飞利浦、联影、GE…发布:2026-03-05 浏览:5 次
对于适应性智能体而言,一个主要挑战在于实现行为灵活性,同时又不损害稳定性——尤其是在不确定环境中进行目标导向学习时。智能体必须在目标变化时进行调整,同时保持对噪声信号的抗干扰能力,这需要一种微妙的权衡:平衡追求目标的灵活性与防止行为失控的稳定性。为了探究大脑如何应对这一困境,我们结合了模型模拟以及在不同不确定性水平下进行目标导向学习任务时收集的行为和功能性磁共振成像数据。我们的模拟显示,无模型学习在处理灵活性-稳定性权衡时存在困难,而基于模型的学习则能以不同程度的稳定性灵活追求目标。有趣的是,人类参与者表现出既稳定又灵活的目标导向行为。fMRI数据揭示了其背后的机制:目标和不确定性被表示为外侧前额叶皮层和眶额叶皮层中的因子化嵌入。值得注意的是,这些区域中目标在神经表征上的可分离性及其对不确定性的抗扰性与参与者的行为灵活性和稳定性相关。
2025年11月26日,Nature Communications(IF = 15.7)上发表了一篇为“Factorized embedding of goal and uncertainty in the lateral prefrontal cortex guides stably flexible learning”的文章。本文通过结合计算模型、行为实验与fMRI数据分析发现,人类在面对不确定环境时,能够通过侧前额叶皮层(vIPFC、dlPFC)和眶额叶皮层(OFC)对目标与不确定性进行因子化神经编码,从而实现既灵活又稳定的目标导向学习。这种独立的神经表征结构使个体能在目标变化时灵活调整行为,同时在环境噪声中保持目标表征的稳定性,有效解决了认知控制中“灵活性-稳定性”的权衡难题。
图1 目标导向学习中人类行为的灵活稳定。
人类在稳定性与灵活性之间展现出非凡的平衡能力,即便面临突发变化,也能快速制定新计划并调整目标。然而,广泛应用于机器人领域并以AlphaGo与李世石经典对战为代表的"无模型强化学习",却难以同时实现这两种能力。
KAIST(韩国科学技术院)的研究团队发现,这一秘密源于前额叶皮层独特的信息处理方式,该原理可为开发兼具灵活性与稳定性的类脑人工智能奠定基础。
图2 目标和不确定性表征的证据
由脑与认知科学系李相完教授领衔的研究团队与IBM人工智能研究院合作,破译了人脑在不确定情境下管理目标变化的机制,为下一代强化学习指明了新方向。此项研究以博士生成润道为第一作者,IBM人工智能研究院的Mattia Rigotti博士为第二作者,李相完教授担任通讯作者。研究成果已发表于《自然·通讯》期刊。
研究团队指出当前强化学习模型存在一个关键局限:它们无法在追求目标的灵活性与应对不确定环境的稳定性之间取得平衡。而人类却能同时实现这两者。研究团队推测,这种差异源自前额叶皮层处理信息的方式。
该团队通过功能性磁共振成像实验、强化学习模型和先进的人工智能分析,揭示了人类前额叶皮层具备独特的编码结构,可将目标信息和不确定性信息分离表征以避免相互干扰。在这两种信息通道分离更清晰的个体中,研究者观察到他们能够在目标变化时灵活调整策略,同时在环境不确定性中保持稳定的判断能力。
图3 神经目标的鲁棒性与行为的相关性
研究团队将此机制类比为通信技术中的多路复用技术——即多个信号可同时传输而互不干扰。同样,人类前额叶皮层通过两个通道运作:一个通道灵敏追踪目标变化以保障决策灵活性,另一个通道则分离环境不确定性以维持判断稳定。
值得注意的是,前额叶皮层并不只是被动执行第一通道引导的控制,还会主动利用第二通道根据具体情境选择适用的学习策略。这一机制展现了大脑的元学习能力,即它不仅学习"学什么",还决定"如何学"——通过自主选择适合的学习策略。这正是人类能在持续变化的环境中保持适应性的关键所在。
这项研究的影响涵盖多个领域,包括个体强化学习与元学习能力分析、个性化教育设计、认知诊断以及人机交互等。更进一步的是,将这种类脑表征结构嵌入人工智能系统,有望推动类脑思维AI的发展——使AI能更深入理解人类意图与价值观,减少危险判断,并实现与人类更安全的协同合作。
参考文献
Sung Y, Rigotti M, Lee SW. Factorized embedding of goal and uncertainty in the lateral prefrontal cortex guides stably flexible learning. Nat Commun 2025;16(1):11643; doi: 10.1038/s41467-025-66677-w.
资讯来源
https://medicalxpress.com/news/2025-12-brain-ai-human-goals-uncertainty.html
编译:曹修齐
审核:姜震宇