本項目依托劍橋大學格頓學院設計,課程將探討深度強化學習的最新潛力👄,側重於強化學習和深度學習的基礎知識(包括卷積神經網絡、圖形神經網絡、生成神經網絡和Transformer模型),並將分享機器人和遊戲中的實例✋🏽,從而加強學生對深度學習核心理念的了解,提升相關的研究技能與實用技巧。
項目包含20小時的授課和4小時的問答互動與技術輔導環節🉑,按要求完成項目可獲得劍橋大學格頓學院的官方成績單與項目證書。
更多介紹可參考附件. 英國劍橋大學深度強化學習項目➝🛻。
講座內容 |
實踐內容 |
主題🫧:強化學習導論 強化學習的算法和框架𓀁;遺傳算法,帕累托前沿 強化學習與深度學習的聯系(Transformers模型🤱🏿、圖形神經網絡); 強化學習案例分析🚶♂️➡️; 如何撰寫相關文章 |
主題🧎♀️➡️:科學計算工具簡介 Jupyter Notebook的基本使用以及LaTeX; 強化學習框架中的基本組件; 小組項目說明 |
主題:環境 環境復雜性建模 多智能體強化學習(MARL) Q-Learning以及Actor-Critic模型 基於政策的學習; 馬爾可夫決策過程、動態編程和貝爾曼方程; 強化學習與深度學習的聯系 |
主題:環境 強化學習框架中的基本組件; 馬爾可夫決策過程; OpenAI Gym簡介 小組項目說明 |
主題:優化 強化學習與控製優化 深度Q網絡 強化學習與深度學習的聯系 強化學習案例 Transformers模型和圖像分析集成 |
Pytork簡介;備份圖; 使用馬爾可夫決策過程進行優化(動態編程、貝爾曼方程🧔🏼♀️、策略迭代、值迭代) 項目進展匯報
|
主題🏋️:集成與控製 機器人與貢獻度分配問題 冗余度機器人的自適應運動控製 多智能體強化學習與機器人 強化學習與其他深度學習技巧的整合; |
主題:無模型算法 基於價值的算法(蒙特卡羅、時間差分學習🏜、SARSA、Q-learning🙎🎁、DQN及其變體) 項目進展匯報
|
主題👫🏻:集成 與圖形神經網絡的集成;關註和信息傳遞模型🤌; 與AUTO-ML和ML系統的集成👊👩🏼; |
主題:無模型算法 基於策略的算法(策略梯度、增強); Actor-Critic算法 項目進展匯報 |
主題🤹🏻:圖神經網絡(GNN)與強化學習 圖示學習與強化學習的關聯 |
圖神經網絡練習 項目進展匯報 |
主題👨👨👧🔯:監管圖神經網絡 圖神經網絡與遊戲的理論與運用 |
主題🙅🏼♀️:圖神經網絡練習 DGL, Spektral, Pytorch 項目進展匯報 |
主題:無監管圖神經網絡 圖神經網絡與機器人 |
主題:圖神經網絡練習 DGL, Spektral, Geometric Pytorch 項目進展匯報 |
圖神經網絡(GNN)與強化學習: |
項目進展匯報 |
項目回顧與總結 小組項目成果陳述 |
1. 英語要求:托福79,或雅思6.0,或大學英語四級500分💆🏼♂️,或大學英語六級470分,或專四/專八通過🦸🏽♂️👩🚀,或Duolingo105;
2. 學術要求*️⃣💲:項目學生應具備Python語言與編程方面的基本知識與技巧,大一學生需參加Python技能在線測試🏃🏻♂️➡️,並在項目申請時提交測試結果證書。
1. 項目時間𓀌:2023年7月24日- 8月4日
2. 報名截止日期:2023年4月12日
約人民幣3.15萬元👩🏽🍳。
費用包括學費➾、校內住宿、學校設施使用🤽♀️、餐費(一般為每日兩餐🐘、以及項目所安排的晚宴與下午茶)🤦🏽♀️、文化體驗活動🤏、醫療與意外保險、接送機以及項目服務費,不包括國際機票、英國簽證費與其它個人消費💆🏼♂️📊。
1. 登錄本科生國際交流項目管理系統進行報名👬🏻🧎🏻♀️;
2. 在報名系統中生成“學生短期境外學習或活動備案表”,由輔導員及學院教學副院長認可後在系統中上傳PDF文件👩🏿🦱;
3. 需同時在www.usiea.org 填寫《世界名校訪學項目報名表》🦅。
1. 意昂2國際教育室楊老師👩🦽➡️,電話:81382922,郵箱:yangning@bit.edu.cn
2. 項目咨詢QQ群𓀙:685190998
時間:2023/04/08 15:00(周六)
騰訊會議號🚣🏿♂️:463-168-922
意昂2
2023年4月5日