書單推薦
更多
新書推薦
更多

Joy RL

Joy RL

定  價:59.8 元

        

當(dāng)前圖書已被 2 所學(xué)校薦購過!
查看明細

  • 作者:江季,王琦,楊毅遠著
  • 出版時間:2023/12/1
  • ISBN:9787115631541
  • 出 版 社:人民郵電出版社
  • 中圖法分類:TP181 
  • 頁碼:222頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
6
8
3
7
1
1
5
1
4
5
1

讀者對象:機器學(xué)習(xí)人員

本書是《EasyRL:強化學(xué)習(xí)教程》的配套實踐教程。本書將在第一版的基礎(chǔ)上以更加嚴謹?shù)娘L(fēng)格深入淺出地介紹馬爾可夫決策過程、蒙特卡羅方法、時序差分方法、Sarsa、Q-learning等傳統(tǒng)強化學(xué)習(xí)算法,以及策略梯度、近端策略優(yōu)化、深度Q網(wǎng)絡(luò)、深度確定性策略梯度等常見深度強化學(xué)習(xí)算法的基本概念和方法,并以大量生動有趣的例子幫助讀者理解強化學(xué)習(xí)問題的建模過程以及核心算法的細節(jié)。同時,增加最大熵學(xué)習(xí)、多智能體學(xué)習(xí)、離線強化學(xué)習(xí)等內(nèi)容,極大豐富強化學(xué)習(xí)的入門內(nèi)容。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容