随机梯度学习论文-金海东,刘全,陈冬火

随机梯度学习论文-金海东,刘全,陈冬火

导读:本文包含了随机梯度学习论文开题报告文献综述及选题提纲参考文献,主要关键词:强化学习,综合随机梯度下降,自适应学习率,参数预测

随机梯度学习论文文献综述

金海东,刘全,陈冬火[1](2019)在《一种带自适应学习率的综合随机梯度下降Q-学习方法》一文中研究指出在线强化学习中,值函数的逼近通常采用随机梯度下降(Stochastic Gradient Descent,SGD)方法.在每个时间步,SGD方法使用强化学习算法获取随机样本,计算损失函数的局部梯度,单次模型参数更新的计算量小,适合在线学习.但是,由于目标函数不同维度存在梯度差异,SGD方法会产生优化震荡,导致迭代次数增多,收敛速度变慢甚至不能收敛.本文提出一种带自适应学习率的综合随机梯度下降方法(Adaptive Learning Rate on Integrated Stochastic Gradient Descent,ALRI-SGD),对SGD做了两方面改进:(1)在基于参数预测的基础上,利用历史随机梯度信息综合计算当前时间步的更新梯度;(2)根据不同维度的历史梯度信息,动态计算每个维度的学习率.在一定的数学约束条件下,证明了ALRI-SGD方法的收敛性.把ALRI-SGD方法与基于线性函数逼近的离策略Q-学习算法结合,用于求解强化学习中经典的Mountain Car问题和平衡杆问题,并与基于SGD的Q-学习算法进行实验比较.实验结果表明,ALRI-SGD方法能动态匹配模型参数在不同维度上的梯度差异,并使学习率自动更新以适应不同维度的数据特征.ALRI-SGD方法在收敛效率和收敛稳定性两个方面都有提升.(本文来源于《计算机学报》期刊2019年10期)

孙宗豪[2](2018)在《G~0分布的随机梯度变分贝叶斯学习模型研究及应用》一文中研究指出这些年来,随着遥感技术的发展,SAR图像在很多领域得到了广泛的应用,SAR图像处理的基础是SAR图像分割,然而由于SAR图像成像的特殊性,其极不匀质区域一直是分割的难点。目前有使用人工提出特征的方式进行分割,但是这需要专业的背景知识,成本与效率都比较高。在机器学习中,贝叶斯学习模型可以利用先验知识进行推断,能够自适应的学习数据的特征,可以利用该模型来学习极不匀质区域的特征。因此针对这些情况,本文提出了G~0分布随机梯度变分贝叶斯学习模型的SAR图像分割方法,该方法的主要创新如下所示:(1)提出了G~0分布随机梯度变分贝叶斯模型。贝叶斯网络需要对隐变量和近似后验概率进行概率假设,而光学图像中常用的高斯分布不能很好的拟合SAR图像数据,所以不能有效的学习SAR图像的特征。而G~0分布能够很好的刻画SAR图像的统计特征,所以本文结合贝叶斯网络以及G~0分布,对网络中概率分布的假设均使用G~0分布,从而构造出G~0分布变分贝叶斯学习模型,然后对G~0分布n(28)1和n?1两种情况,分别推导出相应学习模型中变分下界的解析形式,从而为后续学习SAR图像混合像素子空间中极不匀质区域的特征提供模型框架。(2)提出了G~0分布随机梯度变分贝叶斯模型的SAR图像分割方法。针对SAR图像语义空间中的混合像素子空间,使用(1)中设计的G~0分布变分贝叶斯学习模型学习极不匀质区域的特征,然后利用学习到的特征,对混合像素子空间进行分割。首先是对每个极不匀质区域都构造一个G~0分布变分贝叶斯学习模型,并且根据每个区域得到的概率密度函数,得到一组相应的矩阵,用该矩阵作为每个区域学习模型的初始化权值。然后将训练后的权值作为对应区域的特征。接下来是根据特征袋的思路,将所有区域学习到的特征连接到一起构成码本,并且计算每个区域到它的投影,通过最大值汇聚的方法得出表征相应区域的特征。最后通过层次聚类得出这些特征的分类,也就是相应极不匀质区域的分类,即混合像素子空间的分割结果。(3)对于(1)中提出的网络,分析了网络中的两个参数。一个是输入神经元个数,也就是输入图像块大小,另一个是隐层神经元个数。首先对于要分析的参数,使用不同值训练(1)中网络,然后对于学习到的特征,使用聚类的方法分析其特征聚类个数,聚类个数的多少反映了特征之间的差异性,也就是说聚类后的个数越多则表示学习到的特征越多。(本文来源于《西安电子科技大学》期刊2018-06-01)

袁月[3](2017)在《基于语义空间和随机梯度变分贝叶斯特征学习的SAR图像分割》一文中研究指出SAR图像分割是SAR图像理解的前提和基础,对后续的分析和解译具有重要影响。而SAR图像极不匀质区域的方向丰富,尺度多变,是SAR图像分割的难点所在,本团队提出的SAR图像层次视觉语义模型可以从语义层面出发,将SAR图像划分为不同的像素子空间,在此基础上对每个像素子空间分别进行无监督分割,可以从语义层面提高分割结果的区域一致性。贝叶斯机器学习在不确定性知识的表达和数据建模方面具有独特优势,结合极不匀质区域的先验模型对贝叶斯网络进行推理,可以学习得到极不匀质区域的本质结构特征。本论文针对上述情况,提出了一种基于语义空间和随机梯度变分贝叶斯特征学习的SAR图像分割方法,主要创新点如下:(1)针对混合像素子空间,提出了一种基于素描约束的随机梯度变分贝叶斯网络模型,对SAR图像的极不匀质区域进行特征学习。首先根据本团队提出的SAR图像层次视觉语义空间,即由SAR图像的素描图得到区域图,将区域图映射到SAR图像,将SAR图像划分为混合像素子空间、结构像素子空间和匀质像素子空间。针对混合像素子空间的每个极不匀质区域,构造基于素描约束的随机梯度变分贝叶斯网络,并对其区域数据建立G~0分布统计模型,进行参数估计得到概率密度函数后,生成一组满足该分布的随机矩阵对网络权值进行初始化,根据素描线段的素描特性对网络进行约束训练,得到训练后的网络权值作为区域特征。然后对区域特征进行最大值汇聚特征编码得到每个极不匀质区域的特征向量,最后采用层次聚类算法对各个极不匀质区域的特征向量进行分类,进而实现对SAR图像混合像素子空间的分割。(2)针对匀质像素子空间,鉴于其主要地物是农田和水域,区域内明暗变化微弱,灰度变化平缓,但具有相干斑噪声的特点,本文提出了基于素描特性和超像素的匀质像素子空间分割方法,根据SAR图像素描线的位置、方向信息,结合分水岭超像素的分割方法对匀质像素子空间进行分割。首先,选择结构像素子空间中表示边界和线目标的素描线作为参考素描线,在参考素描线的两侧选择种子超像素,根据参考素描线的方向和位置信息设计局部区域分割算法,然后按照该算法进行全局的区域划分,得到匀质像素子空间的多个匀质区域,通过灰度共生矩阵提取每个匀质区域的纹理特征,再利用层次聚类的方法对特征进行聚类,进而得到匀质像素子空间的分割结果。最后,设计融合策略,将混合像素子空间、结构像素子空间和匀质像素子空间和的分割结果进行融合,得到SAR图像的最终分割结果。(本文来源于《西安电子科技大学》期刊2017-06-01)

毕宏博,孙明轩,何海港[4](2012)在《多新息随机梯度学习辨识算法》一文中研究指出针对重复时变随机系统,提出沿时间轴采用参数跟踪算法、沿迭代轴采用迭代学习算法的2自由度辨识方法,用于估计系统动态特性中的时变参数.本文在学习辨识算法中引入多新息的思想,给出多新息随机梯度学习辨识方法,并列出几种将递推算法和迭代学习算法结合的多新息学习策略.通过仿真实例,验证了所提算法的有效性.(本文来源于《第叁十一届中国控制会议论文集A卷》期刊2012-07-25)

随机梯度学习论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

这些年来,随着遥感技术的发展,SAR图像在很多领域得到了广泛的应用,SAR图像处理的基础是SAR图像分割,然而由于SAR图像成像的特殊性,其极不匀质区域一直是分割的难点。目前有使用人工提出特征的方式进行分割,但是这需要专业的背景知识,成本与效率都比较高。在机器学习中,贝叶斯学习模型可以利用先验知识进行推断,能够自适应的学习数据的特征,可以利用该模型来学习极不匀质区域的特征。因此针对这些情况,本文提出了G~0分布随机梯度变分贝叶斯学习模型的SAR图像分割方法,该方法的主要创新如下所示:(1)提出了G~0分布随机梯度变分贝叶斯模型。贝叶斯网络需要对隐变量和近似后验概率进行概率假设,而光学图像中常用的高斯分布不能很好的拟合SAR图像数据,所以不能有效的学习SAR图像的特征。而G~0分布能够很好的刻画SAR图像的统计特征,所以本文结合贝叶斯网络以及G~0分布,对网络中概率分布的假设均使用G~0分布,从而构造出G~0分布变分贝叶斯学习模型,然后对G~0分布n(28)1和n?1两种情况,分别推导出相应学习模型中变分下界的解析形式,从而为后续学习SAR图像混合像素子空间中极不匀质区域的特征提供模型框架。(2)提出了G~0分布随机梯度变分贝叶斯模型的SAR图像分割方法。针对SAR图像语义空间中的混合像素子空间,使用(1)中设计的G~0分布变分贝叶斯学习模型学习极不匀质区域的特征,然后利用学习到的特征,对混合像素子空间进行分割。首先是对每个极不匀质区域都构造一个G~0分布变分贝叶斯学习模型,并且根据每个区域得到的概率密度函数,得到一组相应的矩阵,用该矩阵作为每个区域学习模型的初始化权值。然后将训练后的权值作为对应区域的特征。接下来是根据特征袋的思路,将所有区域学习到的特征连接到一起构成码本,并且计算每个区域到它的投影,通过最大值汇聚的方法得出表征相应区域的特征。最后通过层次聚类得出这些特征的分类,也就是相应极不匀质区域的分类,即混合像素子空间的分割结果。(3)对于(1)中提出的网络,分析了网络中的两个参数。一个是输入神经元个数,也就是输入图像块大小,另一个是隐层神经元个数。首先对于要分析的参数,使用不同值训练(1)中网络,然后对于学习到的特征,使用聚类的方法分析其特征聚类个数,聚类个数的多少反映了特征之间的差异性,也就是说聚类后的个数越多则表示学习到的特征越多。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

随机梯度学习论文参考文献

[1].金海东,刘全,陈冬火.一种带自适应学习率的综合随机梯度下降Q-学习方法[J].计算机学报.2019

[2].孙宗豪.G~0分布的随机梯度变分贝叶斯学习模型研究及应用[D].西安电子科技大学.2018

[3].袁月.基于语义空间和随机梯度变分贝叶斯特征学习的SAR图像分割[D].西安电子科技大学.2017

[4].毕宏博,孙明轩,何海港.多新息随机梯度学习辨识算法[C].第叁十一届中国控制会议论文集A卷.2012

标签:;  ;  ;  ;  

随机梯度学习论文-金海东,刘全,陈冬火
下载Doc文档

猜你喜欢