Masterclass Certificate in Policy Optimization Approaches
-- ViewingNow6,825+
Students enrolled
GBP £ 140
GBP £ 202
Save 44% with our special offer
이 과정에 대해
100% 온라인
어디서든 학습
공유 가능한 인증서
LinkedIn 프로필에 추가
완료까지 2개월
주 2-3시간
언제든 시작
대기 기간 없음
과정 세부사항
• Policy Gradients
• Reinforcement Learning Basics
• Actor-Critic Methods
• Proximal Policy Optimization (PPO)
• Deep Deterministic Policy Gradient (DDPG)
• Soft Actor-Critic (SAC)
• Trust Region Policy Optimization (TRPO)
• Advantage Actor-Critic (A2C & A3C)
• Monte Carlo Tree Search (MCTS)
경력 경로