环球门户网

谷歌的DeepMind正在利用神经网络探索多巴胺在学习中的作用

更新时间:2021-10-19 10:19:00

导读 1、深度学习算法可以在很多领域超越人类,从图像分类和读唇到预测未来。然而,虽然他们的熟练程度超出了普通人,但他们的学习速度却处于劣

1、 深度学习算法可以在很多领域超越人类,从图像分类和读唇到预测未来。然而,虽然他们的熟练程度超出了普通人,但他们的学习速度却处于劣势。例如,一些最好的机器学习算法需要数百个小时才能掌握典型的视频游戏,大多数人一个下午就能学会。

2、 根据谷歌子公司DeepMind在《自然神经科学》杂志上发表的一篇论文,这可能与神经递质多巴胺有关。

3、 元学习,即随着时间的推移从例子中快速学习并从这些例子中提取规则的过程,被认为是人类比计算机更有效地获取新知识的原因之一。然而,关于元学习的潜在机制知之甚少。

4、 为了理解这一过程,伦敦DeepMind的研究人员使用递归神经网络来模拟人类生理学,这可以将动作和观察内化,并从训练过程中获得经验。网络奖励预测错误信号。随着时间的推移,数学优化算法通过实验和错误——站在多巴胺上,影响情绪、大脑中的化学运动、疼痛和幸福感,被认为在学习过程中起着关键作用。

5、 研究人员在六个神经科学元学习实验中放松了该系统,并将其性能与接受相同测试的动物进行了比较。其中一个测试名为哈洛实验,要求算法从两个随机选择的图像中进行选择,其中一个与奖励有关。在最初的实验中,受试者(一组猴子)很快学会了选择对象的策略,他们第一次随机选择一个对象,然后第二次选择一个与奖励相关的对象,然后每次都这样做。

6、 该算法的性能与动物实验非常相似,与奖励相关的选择将根据以前从未见过的新图像进行。此外,研究人员指出,学习发生在循环的神经网络中,这支持了多巴胺在元学习中起关键作用的理论。

7、 即使权重(两个神经网络节点之间的强度,类似于大脑中一个放电神经元对另一个神经元的影响)冻结,人工智能系统的性能也是一样的。在动物中,多巴胺被认为通过加强前额叶皮层的突触联系来增强行为。然而,研究人员表示,神经网络行为的一致性表明,多巴胺也可以传输和编码关于任务和规则结构的信息。

8、 DeepMind团队在一篇名为:的博客文章中写道:“长期以来,神经科学家在前额叶皮层观察到了类似的神经活动模式,这种模式具有快速的适应性和灵活性,但一直很难找到足够的解释来解释为什么会出现这种情况。”“前额叶皮层并不依靠缓慢的突触权重变化来学习规则的结构,而是使用直接编码在多巴胺中的基于抽象模型的信息,这为其多样性提供了更令人满意的理由。”

9、 DeepMind的神经网络将注意力转向与奖励相关的图像。

10、 当然,人工智能系统模仿人类生物学的想法并不新鲜。荷兰拉德布德大学的研究人员进行的一项研究发现,循环神经网络可以预测人脑如何处理感觉信息,尤其是视觉刺激。但在很大程度上,这些发现为机器学习提供了信息,而不是神经科学研究。

11、 例如,去年,DeepMind用互补算法构建了一个部分解剖的人脑模型:一个模仿前额叶皮层行为的神经网络和一个扮演海马体角色的“记忆”网络。因此,人工智能机器明显优于大多数神经网络。最近,DeepMind将注意力转向了所谓的“思维机器”,并创建了一个可以将人形推理技能和逻辑应用于问题解决的合成神经网络。

12、 这篇论文的作者写道,多巴胺的研究表明,医学从神经网络研究中获得的益处与计算机科学一样多。

13、 DeepMind团队写道,“利用人工智能的见解来解释神经科学和心理学的发现,突出了每个领域可以为其他领域提供的价值。”“展望未来,我们期望通过获得脑回路具体组织的指导,设计一个加强学习主体学习的新模式,可以从相反的方向获得很多好处。”

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。