![]() ![]() |
增強學習與近似動態(tài)規(guī)劃 讀者對象:高等學校與科研院所中從事人工智能與智能信息處理、機器人與智能控制、智能決策支持系統(tǒng)等專業(yè)領(lǐng)域的研究人員和教師,自動化、計算機與管理學領(lǐng)域其它相關(guān)專業(yè)師生及科研人員
本書對增強學習與近似動態(tài)規(guī)劃的理論、算法及應(yīng)用進行了深入研究和論述。主要內(nèi)容包括:求解Markov鏈學習預(yù)測問題的時域差值學習算法和理論,求解連續(xù)空間Markov決策問題的梯度增強學習算法以及進化一梯度混合增強學習算法,基于核的近似動態(tài)規(guī)劃算法,增強學習在移動機器人導(dǎo)航與控制中的應(yīng)用等。本書是作者在多個國家自然科學基金項目資助下取得的研究成果的總結(jié),意在推動增強學習與近似動態(tài)規(guī)劃理論與應(yīng)用的發(fā)展,對于智能科學的前沿研究和智能學習系統(tǒng)的應(yīng)用具有重要的科學意義。
本書可作為高等院校與科研院所中從事人工智能與智能信息處理、機器人與智能控制、智能決策支持系統(tǒng)等專業(yè)領(lǐng)域的研究和教學用書,也可作為自動化、計算機與管理學領(lǐng)域其他相關(guān)專業(yè)師生及科研人員的參考書。 更多科學出版社服務(wù),請掃碼獲取。 ![]()
你還可能感興趣
我要評論
|