会员   密码 您忘记密码了吗?
1,572,682 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

商品分类

浏览历史

当前位置: 首页 > 简体书 > 強化學習算法入門
強化學習算法入門
上一张
下一张
prev next

強化學習算法入門

作者: (日)曾我部東馬
出版社: 中國水利水電出版社
出版日期: 2023-12-27
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT419.00
市场价格: RM75.33
本店售价: RM67.04
促销价: RM66.29
剩余时间: 请稍等, 正在载入中...
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

作為第一個戰勝圍棋世界冠軍的人工智能機器人AlphaGo,我們知道其主要工作原理是深度學習。隨着AlphaGo Zero和Alpha Zero的相繼發布,作為機器學習經典算法之一的強化學習,在人工智能領域受到了更多的關注。

《強化學習算法入門》使用通俗易懂的語言,按照“原理-公式-程序”的方式,對強化學習的基礎知識進行了詳細講解。書中先讓大家從熟悉的“平均值計算”作為切入點,學習強化學習的基本概念,然後結合實例學習了函數近似方法、深度強化學習的原理和方法等,比較了各算法的特點和應用,並用Python和MATLAB兩種語言進行了編程實現。

《強化學習算法入門》內容豐富,實踐性強,特別適合高校人工智能相關專業學生,機器學習、深度學習工程師等學習強化學習算法。



[日]曾我部東馬,理學博士(物理學專業)。曾任馬克斯·普朗克研究所(德國)博士研究員、劍橋大學(英國)研究員。2009年回到日本,參與創立了Grid公司,擔任董事兼首席技術官。2011年起先後擔任東京大學尖端科學技術研究中心特聘助理教授、特聘副教授。2016年3月起任電氣通信大學副教授,同時兼任Grid公司首席技術顧問、東京大學尖端科學技術研究中心客座研究員至今。

他以開發具有“深度學習—深度強化學習—回歸預測—優化”功能的跨功能機器學習框架∞ReNom而聞名,目前在開發以量子機器學習為代表的最先進量子算法∞ReNomQ的同時,還致力於使用深度強化學習的“在線優化問題”的研究。


目錄