關(guān)于我們
書單推薦
新書推薦

深度強(qiáng)化學(xué)習(xí)原理與實(shí)踐

深度強(qiáng)化學(xué)習(xí)原理與實(shí)踐

定  價:99 元

        

  • 作者:陳仲銘 何明
  • 出版時間:2019/5/1
  • ISBN:9787115505323
  • 出 版 社:人民郵電出版社
  • 中圖法分類:TP181 
  • 頁碼:341
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
5
8
0
7
5
1
3
1
2
5
3
本書構(gòu)建了一個完整的深度強(qiáng)化學(xué)習(xí)理論和實(shí)踐體系:從馬爾可夫決策過程開始,根據(jù)價值函數(shù)、策略函數(shù)求解貝爾曼方程,到利用深度學(xué)習(xí)模擬價值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)。書中詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)相關(guān)算法,如Rainbow、Ape-X算法等,并闡述了相關(guān)算法的具體實(shí)現(xiàn)方式和代表性應(yīng)用(如AlphaGo)。此外,本書還深度剖析了強(qiáng)化學(xué)習(xí)各算法之間的聯(lián)系,有助于讀者舉一反三。 本書分為四篇:初探強(qiáng)化學(xué)習(xí)、求解強(qiáng)化學(xué)習(xí)、求解強(qiáng)化學(xué)習(xí)進(jìn)階和深度強(qiáng)化學(xué)習(xí)。涉及基礎(chǔ)理論到深度強(qiáng)化學(xué)習(xí)算法框架的各方面內(nèi)容,反映了深度強(qiáng)化學(xué)習(xí)領(lǐng)域過去的發(fā)展歷程和研究進(jìn)展,有助于讀者發(fā)現(xiàn)該領(lǐng)域中新的研究問題和方向。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點(diǎn)擊重新得到驗證碼
留言內(nèi)容