Reinforcement Learning
Deep Learning with TensorFlow Workshop Series (Part 4 of 5)
SECTION_TITLE.INSTRUCTOR

SECTION_TITLE.OVERVIEW
Reinforcement Learning
ในคอร์สนี้ คุณจะได้เรียนรู้ Reinforcement Learning ซึ่งเป็นเทคนิคที่ให้เครื่องคอมพิวเตอร์เรียนรู้ด้วยตนเองจากประสบการณ์การลองผิดลองถูก โดยเนื้อหาจะครอบคลุมความรู้ทางด้านทฤษฎี ได้แก่ Markov Decision Processes, Dynamic Programming, Temporal Difference, และ Value Function Approximation ไปจนถึงเทคนิคใหม่ๆ อย่าง Deep Q-Network และ Policy Gradient นอกจากนี้ ใน Codelab คุณจะได้ฝึกฝนการประยุกต์ใช้ Reinforcement Learning ในการสอนเครื่องคอมพิวเตอร์ให้เล่นเกม Lunar Lander อีกด้วย!
คอร์สนี้ได้รับการสนับสนุนจาก KBTG (Kasikorn Business Technology Group) และ Software Park
คอร์สนี้เหมาะสำหรับ
Developers, Data Scientists หรือผู้สนใจ ที่มีความรู้พื้นฐานด้าน Machine Learning และการเขียนโปรแกรมขั้นพื้นฐาน (เราจะใช้ภาษา Python ในบทเรียน)
สิ่งที่คุณจะได้จากคอร์สนี้
- เข้าใจการเรียนรู้ของเครื่องแบบ Reinforcement Learning
- เรียนรู้ทฤษฎีทางคณิตศาสตร์ขั้นพื้นฐานที่เกี่ยวข้องกับการทำ Reinforcement Learning
- ฝึกฝนการประยุกต์ใช้ Reinforcement Learning ในการสอนคอมพิวเตอร์ให้เล่นเกม
SECTION_TITLE.COURSE_OUTLINE
Markov Decision Processes (MDPs)
Agent-Environment Interaction
Live Demo
Finite MDPs
Policies
Returns
Value Functions
Bellman Expectation Equation
Optimal Policies
Bellman Optimal Equation
Dynamic Programming (DP)
Policy Evaluation
Policy Improvement
Policy Iteration
Value Iteration
Limitations
Temporal-Difference (TD)
TD Learning
Q-Learning
Value Function Approximation
Value Function Approximation
Deep Q-Network
RL Codelab
LunarLander Environment
Agents
Deep Q-Learning
Code Walkthrough
Policy Gradient Methods
Policy Gradient Methods
Policy Network
Policy Weights
Policy Gradient Theorem
Policy Gradients
Monte Carlo Policy Gradient Codelab
Monte Carlo Policy Gradient
Code Walkthrough
Lunch Talk Presented by KBTG
Markov Decision Process (MDP)
MDP Policy
Optimal Policy
Value and State-Action Functions
Video Gaming
Board Gaming
Finance and Trading
Robot Navigation
Conversational Dialogue
Computer Vision
Personalized Ad Recommendation
Neural Architecture Search
SECTION_TITLE.FAQS
หากท่านต้องการขอใบเสร็จรับเงิน/ใบกำกับภาษีในนามบุคคลธรรมดา ท่านสามารถกรอกรายละเอียดของท่านเพื่อให้ทีมงานนำข้อมูลไปออกเอกสารได้ ที่ลิงก์นี้ค่ะ แบบฟอร์มขอรับใบกำกับภาษี
สามารถเรียนซ้ำได้ค่ะ
- สำหรับบุคคลทั่วไป คอร์สมีอายุตลอดชีพค่ะ
- สำหรับในนามองค์กร สามารถกลับมาเรียนซ้ำได้ภายใน 1 ปีค่ะ