带adam优化器版本的神经网络

???自己写了一个类似于adam优化的函数,一直想把自己写的神经网络运用到四轴飞行器的训练这个项目里,但又害怕训练效率太低,所以写了一个优化训练的函数,但不是标准的,和标准的有些出入.那个项目Actor-critic用tensorflow好像必须是用后端的一些参数,所以不如用自己的,直接就可以获得参数.???一般来说,optimizer类是单独实现的,nn.forward()计算每

07月29日, 2024

佚名

? ? ?自己写了一个类似于adam优化的函数,一直想把自己写的神经网络运用到四轴飞行器的训练这个项目里,但又害怕训练效率太低,所以写了一个优化训练的函数,但不是标准的,和标准的有些出入.那个项目Actor-critic用tensorflow好像必须是用后端的一些参数,所以不如用自己的,直接就可以获得参数.

? ? ?一般来说,optimizer类是单独实现的,nn.forward()计算每层的输出,loss.backward()计算损失函数对每个参数的导数,optimizer在构造函数里面就传入了nn的parameter的引用(所以可以获得nn的参数和梯度),optimizer.step()根据历史参数和算法将nn的参数向类梯度方向移动一定的距离,我的实现比较简易,没有单独实现optimizer类(pytorch里神经网络的实现步骤)

Actor-crtic好像还必须使用网络并联,这个实现起来好像有点要改结构,以后有空再实现,Actor-Critic本质看代码应该是Q(s,a)的对每个a的导数,和π(s) = a的输出相乘,然后backward更新π(s) = a网络的参数,Q(s,a)(critic)网络也要同时更新,和普通方法相同

动量在帮助函数走出局部最优有作用主要是因为函数自然情况下坑都比较小比较浅,如果人为第挖两个大坑则动量肯定会失效,动量也会使收敛速度减慢.

我猜想标准的神经网络节点应该是这么实现的,其中python里的列表应该会换成Vector3之类的,forwardlst存储后续连接信息:

每一层应该就是一个Node的列表,使用类似于C++ Vector的数据结构存储

self.forwardlist里存放的是一个三元数组,存放所有后继的节点的id,该连接的参数w,导数delta.? ? self.backwardlist里存放的是节点反向连接了哪些节点,只需要存id即可.self.mtop存放在backward算导数时前一层更新到该节点第几个连接了,由于对python里类似于Vector的数据结构不够了解,所以没有实现(list好像效率不够,因为里面可以存储不同的变量,需要可以存储相同变量的容器,比如c++的vector,效率更高),每次后一层backward时要将前一层的self.mtop清0,

? ? ?该实现有点类似于图论中邻接表的实现.前一份代码实现有点类似于邻接矩阵,应该在全连接层的效率是非常高的(完全图使用邻接矩阵效率应该是更高的),但只能用于全连接层,卷积神经网络和连接的稍微一点变化的网络都必须使用类似于邻接表的实现,

? ? ?之后又将该网络用于试验猫狗大战提取到的特征在全连接层上的训练,效果还可以,用于提取bottle_neck_feature的模型有VGG19,InceptionResNetV2,Xception(参数经过微调)模型

? ? 最好的结果如下图所示:

? ? ?后面发现卷积神经网络可以使用python numpy切片实现,数据每层存储输出存储为二维的,但测试起来有些难度,以后有空会写一写.

? ? ?

带adam优化器版本的神经网络

What happened to MSN through Microsoft E

最新人教册地理超详细初中学业结业水平考试题（完整版）(附答案).docx

电商究竟是做啥的？三分钟给你讲明白

数学符号大全

出国留学英文推荐信格式

张雪峰建议女生选的专业(张雪峰建议女生选的专业汇总)

出国留学的好处有哪些？_1

美声专业留学去哪好？美声留学大学推荐

美国TOP20和英国G5申请难度对比，英美留学哪个国家更容易？｜学校选择｜学制对

英国有哪些大学开设了考古学专业？这6大名校是学习的好去处

美国一懒马下雪天不进屋爱躺着睡觉常被误以为已死

男子野外探险，发现了奇怪金属，专家推测可能来自外星

非洲寿命最长的树木，一次可储100吨水，穷人还能当房子住！

大败局！万人“围攻”ofo总部，独角兽一地鸡毛！

万达继续大甩卖：27亿出清保险，15月减债2158亿，负债还有多少？

这些国家的国庆节竟然是这样庆祝的；只能说有才了