Online Course

Reinforcement Learning

Deep Learning with TensorFlow Workshop Series (Part 4 of 5)
ฟรี
บทเรียนความยาว 2:30 ชม.

รายละเอียด

Reinforcement Learning

ในคอร์สนี้ คุณจะได้เรียนรู้ Reinforcement Learning ซึ่งเป็นเทคนิคที่ให้เครื่องคอมพิวเตอร์เรียนรู้ด้วยตนเองจากประสบการณ์การลองผิดลองถูก โดยเนื้อหาจะครอบคลุมความรู้ทางด้านทฤษฎี ได้แก่ Markov Decision Processes, Dynamic Programming, Temporal Difference, และ Value Function Approximation ไปจนถึงเทคนิคใหม่ๆ อย่าง Deep Q-Network และ Policy Gradient นอกจากนี้ ใน Codelab คุณจะได้ฝึกฝนการประยุกต์ใช้ Reinforcement Learning ในการสอนเครื่องคอมพิวเตอร์ให้เล่นเกม Lunar Lander อีกด้วย!

คอร์สนี้ได้รับการสนับสนุนจาก KBTG (Kasikorn Business Technology Group) และ Software Park

คอร์สนี้เหมาะสำหรับ

Developers, Data Scientists หรือผู้สนใจ ที่มีความรู้พื้นฐานด้าน Machine Learning และการเขียนโปรแกรมขั้นพื้นฐาน (เราจะใช้ภาษา Python ในบทเรียน)

สิ่งที่คุณจะได้จากคอร์สนี้

  • เข้าใจการเรียนรู้ของเครื่องแบบ Reinforcement Learning
  • เรียนรู้ทฤษฎีทางคณิตศาสตร์ขั้นพื้นฐานที่เกี่ยวข้องกับการทำ Reinforcement Learning
  • ฝึกฝนการประยุกต์ใช้ Reinforcement Learning ในการสอนคอมพิวเตอร์ให้เล่นเกม

เนื้อหาในคอร์ส

01
Reinforcement Learning (RL)
What is RL?
2:12
The RL Interface
1:59
Characteristics of RL
2:35
Elements of RL
3:23
Examples of RL
3:40
Agent-Environment Interaction
1:47
Live Demo
5:40
Finite MDPs
5:00
Policies
1:34
Returns
2:18
Value Functions
1:39
Bellman Expectation Equation
4:40
Optimal Policies
1:55
Bellman Optimal Equation
2:08
Policy Evaluation
5:10
Policy Improvement
1:59
Policy Iteration
1:00
Value Iteration
1:06
Limitations
1:26
TD Learning
3:40
Q-Learning
1:11
Value Function Approximation
2:33
Deep Q-Network
1:13
LunarLander Environment
3:47
Agents
0:42
Deep Q-Learning
8:37
Code Walkthrough
14:07
Policy Gradient Methods
1:42
Policy Network
0:49
Policy Weights
1:26
Policy Gradient Theorem
1:22
Policy Gradients
1:11
Monte Carlo Policy Gradient
5:12
Code Walkthrough
10:10
Markov Decision Process (MDP)
4:47
MDP Policy
0:57
Optimal Policy
0:31
Value and State-Action Functions
1:10
Video Gaming
3:58
Board Gaming
5:35
Finance and Trading
0:56
Robot Navigation
5:13
Conversational Dialogue
4:08
Computer Vision
4:07
Personalized Ad Recommendation
2:38
Neural Architecture Search
2:18

ผู้สอน

Google Developers Experts (Machine Learning) | Skooldio Instructor
Google Developers Experts
Machine Learning