書單推薦
更多
新書推薦
更多

深度強(qiáng)化學(xué)習(xí)算法原理與實戰(zhàn):基于MATLAB

深度強(qiáng)化學(xué)習(xí)算法原理與實戰(zhàn):基于MATLAB

定  價:109 元

        

  • 作者:鄭一 編著
  • 出版時間:2025/9/1
  • ISBN:9787122475756
  • 出 版 社:化學(xué)工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁碼:339
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
4
8
7
7
5
1
7
2
5
2
6

讀者對象:本書可作為高等院校深度強(qiáng)化學(xué)習(xí)課程的教材,亦可作為本科生畢業(yè)設(shè)計、研究生項目設(shè)計和廣大科研人員的技術(shù)參考用書。

本書在詳細(xì)闡述強(qiáng)化學(xué)習(xí)基本概念與基本理論的基礎(chǔ)上,循序漸進(jìn)地介紹了深度強(qiáng)化學(xué)習(xí)各常用算法的基本思想、算法偽代碼、算法實現(xiàn)、基于實例的算法演示與程序分析等內(nèi)容。具體介紹了Q-learning算法求解最優(yōu)路徑問題,SARSA算法求解最優(yōu)安全路徑問題,策略迭代算法求解兩地租車最優(yōu)調(diào)度問題,價值迭代算法求解最優(yōu)路徑問題,DQN?算法求解平衡系統(tǒng)的最優(yōu)控制問題,PG算法求解雙積分系統(tǒng)的最優(yōu)控制問題,AC類算法求解股票交易的最優(yōu)推薦策略,SAC算法求解機(jī)器人手臂控球平衡問題,PPO算法求解飛行器平穩(wěn)著陸最優(yōu)控制問題,DDPG算法求解四足機(jī)器人行走控制策略問題,TD3算法求解PID控制器參數(shù)整定問題,多智能體強(qiáng)化學(xué)習(xí)的基本概念與基本方法,MAPPO算法求解多智能體協(xié)作運送物體問題,IPPO算法與MAPPO算法求解協(xié)作競爭探索區(qū)域問題,MADDPG與DDPG算法求解車輛路徑跟蹤控制問題。
本書可作為高等院校深度強(qiáng)化學(xué)習(xí)課程的教材,亦可作為本科生畢業(yè)設(shè)計、研究生項目設(shè)計和廣大科研人員的技術(shù)參考用書。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容