Big 4c6625b0bd753c62
  • Thumb 4c6625b0bd753c62
  • Thumb 4c6625b0bd753c62
催生 AlphaGo 的核心技術,六種演算法強化機器決策能力

強化學習技術解析(202006)


【限時優惠期間】

6/13 (六)開課!跟著業界高手實戰AutoML!

講師 Jerry 是 Google 認證的機器學習開發專家(GDE),品質保證。

強化學習是催生 AlphaCraft、 AlphaGo 的技術。

強化學習核心概念具有共通性,可以衍伸到各種領域應用。

強化學習能自主產生學習資訊,不需要借助大量經驗數據。

搭配深度學習使用,增強處理問題的能力實現自主學習。

6個理由,為什麼要來上課?

  • 強化學習是催生 AlphaCraft、 AlphaGo 的技術。
  • 強化學習核心概念具有共通性,可以衍伸到各種領域應用。
  • 自主產生學習資訊,不需要借助大量經驗數據。
  • 搭配深度學習使用,增強處理問題的能力實現自主學習。
  • 講師 Jerry 是 Google 認證的機器學習開發專家(GDE),品質保證。
  • 認識講師,遇到困難有人回答;書本資料太多、網路上的資料太分散,現場有人教學得快。

【課程內容】

1. 強化學習概論

  • 馬可夫決策過程 (Markov decision process)
  • 價值函數(Value Functions)
  • 貝爾曼方程 (Bellman Equations)

2. 深入強化學習

  • 動態規劃法(Dynamic Programming)
  • 蒙地卡羅方法(Monte Carlo Methods)
  • 時間差分學習法(Temporal-Difference Learning)

3. 深度強化學習主流演算法

  • Deep Q-Learning
  • DQN
  • DDQN
  • Dueling DQN
  • DRQN
  • Advantage Actor Critic(A2C)

【課程資訊】

時間:2020/6/13(六) 早上 09:30~下午 16:30 ,午休 1 小時

地點:T客邦總部,台北市中山區民生東路二段141號6F (Google 地圖)

【注意事項】

  • 請學員自備筆電,教室提供電源插座。
  • 建議具備 Python 程式語言基礎為佳。
  • 課程學員皆附當日午餐。

主辦單位:

【課程】用Google TensorFlow實作推薦系統,讓機器學習應用各種商務情境、提升商品曝光達到精準行銷

強化學習(Reinforcement Learning)

強化學習的核心思想就是 Trail & Error,其中包含四大元素:

  1. 策略(Policy):環境的感知狀態到行動的映射方式。
  2. 反饋(Reward):環境對智能體行動的反饋。
  3. 價值函數(Value Function):評估狀態的價值函數,狀態的價值即從當前狀態開始,期望在未來獲得的獎賞。
  4. 環境模型(Model):模擬環境的行為。

強化學習與其他機器學習的不同:

  1. 強化學習更加專註於在線規劃,需要在探索和採用之間找到平衡。
  2. 強化學習不需要監督者,只需要獲取環境的反饋。
  3. 反饋是延遲的,不是立即生成的。
  4. 時間在強化學習中很重要,其數據為序列數據,並不滿足獨立同分布假設。

內容轉載自:https://www.itread01.com/content/1540645094.html

上課講師:吳柏翰(Jerry)

【課程】機器視覺原理與實作,從影像處理到動態分析物體追蹤,用Python+OpenCV打造實際應用

JerryWu現任Google機器學習開發專家(GDE)、亞太智能機器創辦人兼技術長,專注於機器智能(Machine Intelligence)的研發與整合,包含機器視覺(CV)與自然語言理解(NLU)。曾任國立台灣科技大學講師、外商數據科學顧問、裕隆集團/華創車電(股)資深數據科學顧問、DSP智庫驅動(股)共同創辦人兼技術長,歷經許多產、官、學、研機器智能專案。

TVBS採訪:【APMIC亞太智能機器】以機器智能和語意理解受訪TVBS世界翻轉中

【注意事項】

  • T客邦(以下稱主辦單位)保有修改活動內容之權力。
  • 取消活動請打電話或寫 E-Mail 給客服人員或承辦人員,做為提出取消要求的表示。已繳費者若有事無法參加活動,活動舉辦當天0點0分以後提出取消要求者不退費,活動前一天 23:59:59 以前提出取消要求,酌收已付款項之10%做為行政處理費。
  • 本活動以完成付款認定取得報名資格。參加者在課程頁面報名並繳費,若超過48小時付款期限,會將名額讓給其他候補參加者。
  • 為提供訂購、行銷、客戶管理或其他合於營業登記項目或章程所定業務需要之目的,家庭傳媒集團(即英屬蓋曼群島商家庭傳媒股份有限公司城邦分公司、城邦事業股份有限公司、書虫股份有限公司、墨刻出版股份有限公司、城邦原創股份有限公司),於本集團之營運期間及地區內,將以 mail、傳真、電話、簡訊、郵寄或其他公告方式利用您提供之資料(資料類別:C001、C002、C003、C011等)。利用對象除本集團外,亦可能包括相關服務的協力機構。如您有依個資法第三條或其他需服務之處,得致電本公司客服中心電話 0800-020-299 請求協助。相關資料如為非必填項目,不提供亦不影響您的權益。
  • 有任何關於此活動文章上的問題歡迎致電洽詢(02)2518-1133#3464。

商品規格

課程屬於電腦實作,費用不包含任何硬體材料,請學員自備筆電。

催生 AlphaGo 的核心技術,六種演算法強化機器決策能力

強化學習技術解析(202006)


運送說明
  • 若商品有庫存,原則上將於付款完成、訂單成立後,開始進行出貨。
  • 送貨地區:限台灣本島、離島,不提供寄送國外服務。
  • 送貨方式:透過郵局或是一般貨運送達。
退換貨說明
  • 會員所購買的商品享有到貨七天的鑑賞期(包含例假日)。
  • 退回之商品必須於鑑賞期內寄回(以郵戳或收執聯為憑),且商品必須是全新狀態與完整包裝,包含商品、附件、內外包裝、隨貨文件、贈品等。
  • 如果您需要換貨,請先退貨後,再重新下單。
保固資訊
本活動以完成付款來認定報名資格。參加者在此頁面直接報名並繳費,若超過48小時付款期限,會將名額讓給其他候補參加者。