作  者

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
手机远见搜索 |设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

智能控制、进化论与人机交互  CNKI文献

论述了智能控制领域的发展动力及其包括通行含义在内的多种含义,根据当今工程实践对控制技术的要求,智能控制中蕴含的智能应具有复杂的递阶结构,从生物智能与进化论的观点对智能控制中智能的递阶结构进行了分析,着...

吴沧浦 《北京理工大学学报》 1997年03期 期刊

关键词: 智能控制 / 智能系统 / 进化论 / 人机交互

下载(213)| 被引(9)

基于最小最大逼近强化学习的误差分析  CNKI文献

在基于动态规划的强化学习中 ,利用状态集结方法可以减小状态空间的大小 ,从而在一定程度上克服了维数灾的困难 ,同时还可以加快学习速度。但状态集结是一种逼近方法 ,由此产生的问题是 ,状态集结后的 Q - hat强化学习...

吴沧浦 刘念泉 《控制与决策》 2000年02期 期刊

关键词: 强化学习 / 马尔可夫决策问题 / 动态规划 / 函数逼近

下载(119)| 被引(3)

优化新技术的进展与自动控制  CNKI文献

优化新技术的进展与自动控制吴沧浦(北京理工大学自动控制系,100081)1引言优化技术在自动控制小几乎是无处不在的.在控制系统的建模与辨识中,各种类型的控制系统的设计(从简单的PID控制系统到复杂的离...

吴沧浦 《控制理论与应用》 1994年01期 期刊

关键词: 自动控制 / 吴沧浦 / 北京理工大学 / 动态规划

下载(63)| 被引(3)

系统工程中的决策方法——一个鸟瞰  CNKI文献

一、引言 “作出决策”是人的一种智能活动,它广泛存在于人类的各种实践活动中,小的如人们在日常生活中所遇到的衣食住行问题,大的到国家的重大政治经济问题,人们经常面临在不同方案中作出抉择的情况。但是,把这种广泛...

吴沧浦 《控制与决策》 1987年04期 期刊

关键词: 决策者偏好 / 对象 / 系统工程 / 决策方法

下载(53)| 被引(1)

系统优化方法中的并行处理与神经网络技术  CNKI文献

自然界中存在许多系统优化的现象,例如,动力系统稳定时其能量达到最小,钟乳石的外形遵循多指标最优化的准则,生物的进化遵循某种最优地适应外界环境的准则等。在人类改造包括其自身的自然界的活动中,对于面临的任何要...

吴沧浦 《控制理论与应用》 1992年03期 期刊

关键词: 最优解 / 并行处理技术 / 动态规划 / 规划论

下载(37)| 被引(2)

随机对象的优选法  CNKI文献

在通过逐次试验以寻求给定区间上单峰函数的最优点这一问题中,单因素优选分数法(菲波那契数法)的最优性在于它使指标——误差极值达到最小。在论证分数法对这一指标的最优性时,有一显然假定,即假定给定区间上的所有单...

吴沧浦 《应用数学学报》 1979年03期 期刊

关键词: 最优决策 / 充分必要条件 / 定理 / 满意决策

下载(21)| 被引(2)

动态规划型的序贯决定过程  CNKI文献

自从动态规划形成最优化方法的重要分支以来,不少工作致力于为它的理论建立更严密的数学基础.其中一个在理论上和应用上都十分重要的问题是:在什么条件下,一个按其问题的实际背景说来并非序贯决定过程的最优化问题,可...

吴沧浦 《数学学报》 1982年03期 期刊

关键词: 表示定理 / 最优决策 / 满意决策 / 定义域

下载(30)| 被引(1)

关于非线性規划中鞍点定理的两点注記  CNKI文献

§1.鞍点定理中的约束规格我们下面将沿用Arrow,Hurwicz,Uzawa在[2]中所用的术语和记号.准鞍点条件:如(?)使f(x)在约束g(x)≥0下取最大值,f(x)和g(x)是可微的,则存在(?)≥0使得(?)+(?)=0,(?)((?))=0.其中x是n维列...

吴沧浦 《数学进展》 1963年01期 期刊

关键词: 鞍点定理 / 代表 / 列向量 / 列矢量

下载(33)| 被引(1)

IFORS第十届大会概况及运筹学动向  CNKI文献

国际运筹学联合会(IFORS)第十届大会于1984年8月6日至10日在美国首都华盛顿举行,参加会议的有来自三十多个国家及地区的四百多名运筹学专家和工作者,我国有四人出席会议並在有关的专题分会上宣读论文,其中中国科学院应...

吴沧浦 《北京工业学院学报》 1985年02期 期刊

关键词: 运筹学 / 专家 / 美国 / 美利坚合众国

下载(25)| 被引(0)

关于培养研究生的体会  CNKI文献

在培养硕士研究生的工作中,处理好充分发挥导师的指导作用与坚持学生独立工作的原则这两者的关系,是一个关键问题。这两者看来似乎存在矛盾,但其实是相辅相成的。在研究生学习和研究的全过程中,导师的指导应当占主导地...

吴沧浦 《学位与研究生教育》 1984年02期 期刊

关键词: 研究生 / 指导

下载(46)| 被引(0)

MULTI-CRITERIA DYNAMIC PROGRAMMING  CNKI文献

A certain chain property possessed by the efficient solution of the multi-criteria optimization problem of dynamic systems is shown under quite general postulates. By using this property a fundamenta...

吴沧浦 《Science in China,Ser.A》 1980年07期 期刊

关键词: MULTI-CRITERIA / DYNAMIC / PROGRAMMING

下载(14)| 被引(0)

第九届国际自控联(IFAC)大会论文评介  CNKI文献

工业系统工程(Sessions 11.3/A 11.3/B)本专题有两次分组会,共八篇论文,大部分研究工业系统的运行最优化问题。其中,钢铁工业方面三篇,石油工业方面两篇,化学工业一篇,玻璃工业一篇,软件工程一篇。(11.3/A-1)《以多指...

吴沧浦 《国外自动化》 1985年06期 期刊

关键词: 非线性规划 / 最优化问题 / 轧制规程 / 规划论

下载(15)| 被引(0)

美国第廿届CDC会议简况  CNKI文献

美国自动控制学界有两个规模较大的学术年会,一叫联合自动控制会议(JACC),另一叫决策与控制会议(CDC)。前者是由美国AIAA、AIChE、ASME、IEEE等学会轮流主办的,后者则由美国IEEE的控制系统学会和SIAM联合主办。通常,此...

吴沧浦 《国外自动化》 1983年04期 期刊

关键词: 自适应控制 / 分会 / 机器人控制 / CDC

下载(18)| 被引(0)

基于Q学习算法和BP神经网络的倒立摆控制  CNKI文献

Q学习是Watkins[1]提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.将Q学习算法和BP神经网络有效结合,实现了状态未离散化的倒立摆的无模型学习控制.仿真表明:该方法不仅能成功解决确定和...

蒋国飞 吴沧浦 《自动化学报》 1998年05期 期刊

关键词: Q学习 / BP网络 / 学习控制 / 倒立摆系统

下载(1588)| 被引(217)

兵力部署优化问题的两层规划模型  CNKI文献

在对军事作战中兵力部署和指挥关系分析的基础上,提出了一种考虑两级指挥关系的兵力部署优化模型,即两层非线性整数规划模型。从理论上研究了这种两层规划模型的特点,并且提出了一种基于动态规划的递阶优化算法,最...

李志刚 吴沧浦 《北京理工大学学报》 1997年03期 期刊

关键词: 兵力部署 / 作战模型 / 两层规划 / 整数规划

下载(283)| 被引(43)

Q学习算法在库存控制中的应用  CNKI文献

Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的有连续状态和决策空间的库存控制问题.仿真表明...

蒋国飞 吴沧浦 《自动化学报》 1999年02期 期刊

关键词: Q学习 / 马尔可夫决策过程 / 库存控制 / 连续状态和决策空间

下载(431)| 被引(34)

一种求解混合整数非线性规划问题的模拟退火算法  CNKI文献

通过适当处理离散变量,将求解无约束非凸NLP问题的高效模拟退火全局优化算法推广到求解一般非凸混合整数非线性规划(MINLP)问题。数值计算结果表明,文中模拟退火算法在适用性、解的质量和计算效率等方面优...

杨若黎 吴沧浦 《控制与决策》 1996年01期 期刊

关键词: 模拟退火 / 随机搜索 / 全局优化 / 混合整数非线性规划

下载(449)| 被引(15)

平均报酬模型的多步强化学习算法  CNKI文献

讨论模型未知的平均报酬强化学习算法 .通过结合即时差分学习与R学习算法 ,将折扣问题中的一些方法推广到了平均准则问题中 ,提出了两类算法 :R(λ)学习与截断即时差分TTD(λ)学习 .现有的R学习可视为R(λ)学习和TTD(...

胡光华 吴沧浦 《控制理论与应用》 2000年05期 期刊

关键词: 强化学习 / 即时差分学习 / 马氏决策过程 / R学习

下载(150)| 被引(17)

一种基于状态聚类的SARSA(λ)强化学习算法  CNKI文献

为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行SARSA(λ)学习。若能进行适当...

李春贵 吴沧浦... 《计算机工程》 2003年05期 期刊

关键词: 强化学习 / 函数近似 / 状态聚类 / SARSA学习

下载(194)| 被引(11)

一种新的非线性规划神经网络模型  CNKI文献

提出一种新型的求解非线性规划问题的神经网络模型。该模型由交量神经元、Lagrange乘子神经元和Kuhn-Tucker乘子神经元相互连接构成。通过将Kuhn-Tucker乘子神经无限制在单边饱和工作方...

杨若黎 吴沧浦 《自动化学报》 1996年03期 期刊

关键词: 神经网络 / 非线性规划 / 最优化

下载(160)| 被引(10)

学术研究指数分析(近十年)详情>>

  • 发文趋势

热门学者(按发文篇数排行)

相关机构

轻松读懂《孙子兵法》