oalib

OALib Journal期刊

ISSN: 2333-9721

费用:99美元

投稿

时间不限

2016 ( 11 )

2015 ( 449 )

2014 ( 460 )

2013 ( 439 )

自定义范围…

匹配条件: “傅启明” ,找到相关结果约10290条。
列表显示的所有文章,均可免费获取
第1页/共10290条
每页显示
部分预应力混凝土梁裂缝闭合弯矩的简便计算
日荣,启明
工业建筑 , 1996, DOI: 10.13204/j.gyjz199607008
Abstract: 根据对先张法部分预应力混凝土矩形梁裂缝间合性能的试验研究和全过程非线性分析,在试验梁基础上模拟计算了40根梁,研究了裂缝闭合弯矩与其主要影响参数的关系,给出了裂缝闭合弯矩的简便计算方法。
支持合并的自适应tilecoding算法
施梦宇,刘全,启明
通信学报 , 2015,
Abstract: ?针对自适应tilecoding算法会产生多余划分的问题,提出一种支持合并的自适应tilecoding算法——matc。该算法能够消除传统自适应tilecoding算法中产生的多余划分,进一步解决连续状态空间离散化的问题。将matc算法应用于离散动作连续状态的mountaincar问题上,实验结果表明,该算法在学习过程中能消除传统tilecoding算法的误划分所产生的不良影响,更准确地自动调整划分的精度,并更快地收敛到最佳策略。
一种批量最小二乘策略迭代方法
周鑫?,刘全?,启明,肖飞?
计算机科学 , 2014, DOI: 10.11896/j.issn.1002-137X.2014.09.044
Abstract: 策略迭代是一种迭代地评估和改进控制策略的强化学习方法。采用最小二乘的策略评估方法可以从经验数据中提取出更多有用信息,提高数据有效性。针对在线的最小二乘策略迭代方法对样本数据的利用不充分、每个样本仅使用一次就被丢弃的问题,提出一种批量最小二乘策略迭代算法(blspi),并从理论上证明其收敛性。blspi算法将批量更新方法与在线最小二乘策略迭代方法相结合,在线保存生成的样本数据,多次重复使用这些样本数据并结合最小二乘方法来更新控制策略。将blspi算法用于倒立摆实验平台,实验结果表明,该算法可以有效利用之前的经验知识,提高经验利用率,加快收敛速度。
部分预应力混凝土梁裂缝闭合的试验研究
日荣,传国,启明,丁大钧
工业建筑 , 1995, DOI: 10.13204/j.gyjz199512003
Abstract: 本本根据12根先张法部分预应力混凝土梁的试验结果,研究了部分预应力混凝土梁的裂缝闭合性能.提出裂缝闭合标准.分析了影响裂缝闭合的主要因素,建立起裂缝闭合模型.并约制程序进行了非线性全过程分析.分析计算了裂缝闭合弯矩.计算值与实测值吻合良好。
遗传反馈的多特征图像检索
启明,刘全,王晓燕,张乐
中国图象图形学报 , 2011, DOI: 10.11834/jig.20111002
Abstract: 基于内容的图像检索是随着数字多媒体技术的发展和普及而新兴的一门信息检索技术。针对当前该领域存在的对图像描述不准确、查询精度低以及反馈次数较多的问题,提出一种基于遗传反馈的图像检索算法。该算法以遗传算法和相关反馈为基础,利用多特征进行检索,避免在利用单一特征进行检索时所出现的不同图像具有相同单一特征(颜色、纹理和形状等)的问题,对图像进行多特征描述可以从多个角度对图像进行定义,大大减少了不同图像却具有相同特征的概率。与现有的算法相比,其具有自动调整图像特征权重、较低反馈次数和较高查询精度的特性。实验结果表明,该算法对于旋转、平移和尺度变化具有较强的鲁棒性,同时具有减少反馈次数和较高查询精度的性能。
分布式数据库中基于局部con模型的记录匹配方法
李娇,刘全,启明,王庭钢
通信学报 , 2011,
Abstract: ?针对现有记录匹配方法需要相关领域专家大量的人工参与或严重依赖于启发式规则,且无法处理大规模数据的问题,提出一种基于局部con模型的记录匹配方法。该方法利用关联规则发现算法挖掘匹配依赖,将匹配依赖和数据实例同时作为改进型tableau的输入,检测匹配得出结果。实验结果和理论分析表明,该方法能快速识别出分布式记录匹配情况,且不需要人工参与,效率有非常明显的提高。
基于自适应势函数塑造奖赏机制的梯度下降sarsa(λ)算法
肖飞,刘全,启明,孙洪坤,高龙
通信学报 , 2013,
Abstract: ?针对连续状态空间下的强化学习算法初始性能差及收敛速度慢的问题,提出利用自适应势函数塑造奖赏机制来改进强化学习算法。该机制通过额外的奖赏信号自适应地将模型知识传递给学习器,可以有效提高算法的初始性能及收敛速度。鉴于径向基函数(rbf)网络的优良性能及存在的问题,提出利用自适应归一化rbf(anrbf)网络作为势函数来塑造奖赏。基于anrbf网络提出了梯度下降(gd)版的强化学习算法——anrbf-gd-sarsa(λ)。从理论上分析了anrbf-gd-sarsa(λ)算法的收敛性,并通过实验验证了anrbf-gd-sarsa(λ)算法具有较好的初始性能及收敛速度。
基于tableau结点封闭值的非一致性数据库开放分支修复方法
高龙?,刘全?,启明,李娇?
计算机科学 , 2013,
Abstract: 在将tableau方法扩展到非一致性数据库修复的基础上,提出一种新的利用分支封闭值修复数据库的方法。该方法结合tableau分析法的开放和封闭推理标准,以开放公式树tp(ic∪r)分支为基础,为公式树tp(ic∪r)中每个结点引入一个结点封闭值。根据tp(ic∪r)中结点封闭值的定义,通过计算tp(ic∪r)的结点封闭值来选择分支进行开放修复,从而可以直接确定数据库的修复实例,同时考虑了含有i封闭的修复,将开放修复扩展到含有i封闭的tp(ic∪r),并给予逻辑证明。最后,对于一致性应答结果的逻辑特征予以证明。
莺—琼盆地气源岩排烃实验研究
耿安松,周毅,家谟,盛国英,启明
沉积学报 , 1995,
Abstract: 本文对莺—琼盆地崖城组和梅山组气源岩样品进行了排烃模拟实验,结果表明梅山组样品单位有机碳的总产烃能力比崖城组差,崖13-1气田的天然气可能属多来源的,是高成熟气源岩的产物。
一种二阶TDError快速Q(λ)算法
启明,刘全,孙洪坤,高龙,李瑾,王辉
模式识别与人工智能 , 2013,
Abstract: Q(λ)学习算法是一种结合值迭代与随机逼近的思想的基于模型无关的多步离策略强化学习算法.针对经典的Q(λ)学习算法执行效率低、收敛速度慢的问题,从TDError的角度出发,给出n阶TDError的概念,并将n阶TDError用于经典的Q(λ)学习算法,提出一种二阶TDError快速Q(λ)学习算法——SOE-FQ(λ)算法.该算法利用二阶TDError修正Q值函数,并通过资格迹将TDError传播至整个状态动作空间,加快算法的收敛速度.在此基础之上,分析算法的收敛性及收敛效率,在仅考虑一步更新的情况下,算法所要执行的迭代次数T主要指数依赖于11-γ、1ε.将SOE-FQ(λ)算法用于RandomWalk和MountainCar问题,实验结果表明,算法具有较快的收敛速度和较好的收敛精度.
第1页/共10290条
每页显示


Home
Copyright © 2008-2017 Open Access Library. All rights reserved.