我们仔细观察PPT的时候,面临整个场景,会一下子处置全部场景信息,而不会有选择地分配注意力,每次注目有所不同的区域,然后将信息统合来获得整个的视觉印象,进而指导后面的眼球运动。将感兴趣的东西放到视野中心,每次只处置视野中的部分,忽视视野外区域,这样做到仅次于的益处是减少了任务的复杂度。深度自学领域中,处置一张大图的时候,用于卷积神经网络的计算出来量随着图片像素的减少而线性减少。
如果参照人的视觉,有选择地分配注意力,就能选择性地从图片或视频中萃取一系列的区域,每次只对萃取的区域展开处置,再行渐渐地把这些信息融合一起,创建场景或者环境的动态内部回应,这就是本文所要描写的循环神经网络注意力模型。怎么构建的呢?把注意力问题当作一系列agent决策过程,agent可以解读为智能体,这里用的是一个RNN网络,而这个决策过程是目标导向的。
详细来讲,每次agent只通过一个比特率容许的传感器仔细观察环境,每一步处置一次传感器数据,再行把每一步的数据随着时间融合,自由选择下一次如何配备传感器资源;每一步不会拒绝接受一个标量的奖励,这个agent的目的就是最大化标量奖励值的总和。下面我们来明确介绍一下这个网络。
如上右图,图A是比特率传感器,传感器在等价方位挑选有所不同分辨率的图像块,大一点的图像块的边长是小一点图像块边长的两倍,然后resize到和小图像块一样的大小,把图像块两组输入到B。图B是glimpsenetwork,这个网络是以theta为参数,两个仅有相连层包含的网络,将传感器输入的图像块组和对应的方位信息以线性网络的方式融合到一起,输入gt。图C是循环神经网络即RNN的主体,把glimpsenetwork输入的gt投进去,再行和之前内部信息ht-1融合,获得新的状态ht,再行根据ht获得新的方位lt和新的不道德at,at自由选择下一步配备传感器的方位和数量,以更佳的仔细观察环境。
本文关键词:如何,实现,模拟,威9国际真人,人类,视觉,注意力,的,循环
本文来源:威9国际真人-www.cptouxiang.com