智能控制與強化學習先進值迭代評判設計

当前位置: 首页 > 简体书 > 智能控制與強化學習先進值迭代評判設計

详细介绍商品属性商品标记

內容簡介

在人工智能技術的大力驅動下，智能控制與強化學習發展迅猛，先進自動化設計與控制日新月異。本書針對複雜離散時間系統的優化調節、最優跟蹤、零和博弈等問題，以實現穩定學習、演化學習和快速學習為目標，建立一套先進的值迭代評判學習控制理論與設計方法。首先，對先進值迭代框架下迭代策略的穩定性進行全面深入的分析，建立一系列適用於不同場景的穩定性判據，從理論層面揭示值迭代算法能夠實現離線最優控制和在線演化控制。其次，基於迭代歷史信息，提出一種新穎的收斂速度可調節的值迭代算法，有助於加快學習速度、減少計算代價，更高效地獲得非線性系統的最優控制律。結合人工智能技術，對無模型值迭代評判學習控制的發展前景也進行了討論。

本書內容豐富、結構清晰、由淺入深、分析透徹，既可作為智能控制、強化學習、優化控制、計算智能、自適應與學習系統等領域研究人員和學生的參考書，又可供相關領域的技術人員使用。

王鼎，男，北京工業大學教授、博士生導師，現任計算智能與智能系統北京市重點實驗室副主任。北京市自然科學基金傑出青年項目獲得者、科睿唯安(Clarivate)全球高被引科學家、中國科協青年人才托舉工程入選者，主要研究方向為智能控制與智能優化、神經網絡與強化學習，涉及複雜智能控制優化、人工智能理論基礎。針對不確定系統優化控制中的共性難題進行了長期研究攻關，建立並逐步完善智能評判控制框架，併為工業複雜系統的智能優化控制提供了理論支撐。目前已在人工智能及相關領域的國際期刊和會議上發表學術論文120余篇，其中82篇被SCI檢索(以第一作者發表在IEEE Transactions系列期刊和Automatica領域頂刊的論文共25篇)，已出版專著4本，申請和已授權發明專利9項。先後榮獲吳文俊人工智能優秀青年獎、中國自動化學會自然科學獎一等獎、廣東省自然科學獎一等獎等。

先後擔任人工智能及相關領域多個著名期刊的編委，包括：IEEE Transactions on Systems, Man, and Cybernetics: Systems、IEEE Transactions on Neural Networks and Learning Systems、Neural Networks、International Journal of Robust and Nonlinear Control、International Journal of Adaptive Control and Signal Processing、Neurocomputing、自動化學報。

智能控制與強化學習先進值迭代評判設計


作者：	王鼎，趙明明，哈明鳴，任進
出版社：	人民郵電出版社
出版日期：	2024-03-01
商品库存：	点击查询库存
	以上库存为海外库存属流动性。可选择“空运”或“海运”配送，空运费每件商品是RM14。配送时间：空运约8~12个工作天，海运约30个工作天。（以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品）
定价：	NT839.00
市场价格：	RM150.83
本店售价：	RM134.24

购买数量：


作者	王鼎，趙明明，哈明鳴，任進
出版社	人民郵電出版社
ISBN	9787115633958
出版日期	2024-03-01
开本
页数	236
装帧	平裝
规格	0 / 無 / 普級
版次	1-1
版本（简/繁）

有店 App

当前分类

商品分类

浏览历史

智能控制與強化學習先進值迭代評判設計