건조젤리의 저장소

1. Reinforcement learning 본문

공부 기록/모두를 위한 딥러닝 (RL)

1. Reinforcement learning

건조젤리 2019. 11. 18. 12:44

김성훈 교수님의 강의내용을 정리한 내용입니다.

출처 : http://hunkim.github.io/ml/

 

모두를 위한 머신러닝/딥러닝 강의

 

hunkim.github.io


강아지를 훈련시킬 때 보상을 기반으로 한 방법이 효율적이다.

 

강화학습은 이러한 방법을 사용한다.

 

우리들이 긍정적인 칭찬과 부정적인 비평에서 배움을 얻듯이 강화학습은 이러한 상호작용으로 학습한다.

 

Actor는 Enviroment을 관찰하며 행동을 취하고 보상을 받는다.

강화학습은 위와같은 다양한 분야에서 이용이 가능하다.

 

'공부 기록 > 모두를 위한 딥러닝 (RL)' 카테고리의 다른 글

4-1. Q-learning  (0) 2019.11.19
3-2. Dummy Q-learning 구현  (0) 2019.11.18
3-1. Dummy Q-learning  (0) 2019.11.18
2-2. Playing OpenAI GYM Games  (0) 2019.11.18
2-1. Playing OpenAI GYM Games  (0) 2019.11.18
Comments