在人工智能技術的大力驅動下,智能控制與強化學習發展迅猛,先進自動化設計與控制日新月異。本書針對複雜離散時間系統的優化調節、最優跟蹤、零和博弈等問題,以實現穩定學習、演化學習和快速學習為目標,建立一套先進的值迭代評判學習控制理論與設計方法。首先,對先進值迭代框架下迭代策略的穩定性進行全面深入的分析,建立一系列適用於不同場景的穩定性判據,從理論層面揭示值迭代算法能夠實現離線最優控制和在線演化控制。其次,基於迭代歷史信息,提出一種新穎的收斂速度可調節的值迭代算法,有助於加快學習速度、減少計算代價,更高效地獲得非線性系統的最優控制律。結合人工智能技術,對無模型值迭代評判學習控制的發展前景也進行了討論。
本書內容豐富、結構清晰、由淺入深、分析透徹,既可作為智能控制、強化學習、優化控制、計算智能、自適應與學習系統等領域研究人員和學生的參考書,又可供相關領域的技術人員使用。
王鼎,男,北京工業大學教授、博士生導師,現任計算智能與智能系統北京市重點實驗室副主任。北京市自然科學基金傑出青年項目獲得者、科睿唯安(Clarivate)全球高被引科學家、中國科協青年人才托舉工程入選者,主要研究方向為智能控制與智能優化、神經網絡與強化學習,涉及複雜智能控制優化、人工智能理論基礎。針對不確定系統優化控制中的共性難題進行了長期研究攻關,建立並逐步完善智能評判控制框架,併為工業複雜系統的智能優化控制提供了理論支撐。目前已在人工智能及相關領域的國際期刊和會議上發表學術論文120余篇,其中82篇被SCI檢索(以第一作者發表在IEEE Transactions系列期刊和Automatica領域頂刊的論文共25篇),已出版專著4本,申請和已授權發明專利9項。先後榮獲吳文俊人工智能優秀青年獎、中國自動化學會自然科學獎一等獎、廣東省自然科學獎一等獎等。
先後擔任人工智能及相關領域多個著名期刊的編委,包括:IEEE Transactions on Systems, Man, and Cybernetics: Systems、IEEE Transactions on Neural Networks and Learning Systems、Neural Networks、International Journal of Robust and Nonlinear Control、International Journal of Adaptive Control and Signal Processing、Neurocomputing、自動化學報。