書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)的數(shù)學(xué)原理

 強化學(xué)習(xí)的數(shù)學(xué)原理

定  價:108 元

        

當前圖書已被 3 所學(xué)校薦購過!
查看明細

  • 作者:趙世鈺
  • 出版時間:2025/5/1
  • ISBN:9787302685678
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
8
7
5
3
6
0
7
2
8

本書將從強化學(xué)習(xí)最基本的概念開始介紹,將介紹基礎(chǔ)的分析工具包括貝爾曼公式和貝爾曼最優(yōu)公式,之后會推廣到基于模型的和無模型的強化學(xué)習(xí)算法,最后會推廣到基于函數(shù)逼近的強化學(xué)習(xí)方法。本書強調(diào)從數(shù)學(xué)的角度接引入概念、分析問題、分析算法。并不強調(diào)算法的編程實現(xiàn),因為目前已經(jīng)有很多這方面的書籍,本書將不再重復(fù)造輪子。

本書面向?qū)娀瘜W(xué)習(xí)感興趣的本科生、研究生、研究人員和企業(yè)研究所從業(yè)者。

它不需要讀者有任何關(guān)于強化學(xué)習(xí)的背景,因為它會從最基本的概念開始介紹。如果讀者已經(jīng)有一些 強化學(xué)習(xí)的背景,這本書也可以幫助他們更深入地理解一些問題或者帶來新的視角。

本書要求讀者具備一定的概率論和線性代數(shù)知識。本書的附錄中包含了一些必需的數(shù)學(xué)基礎(chǔ)知識。

 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容