건조젤리의 저장소

2-1. Playing OpenAI GYM Games 본문

공부 기록/모두를 위한 딥러닝 (RL)

2-1. Playing OpenAI GYM Games

건조젤리 2019. 11. 18. 13:17

김성훈 교수님의 강의내용을 정리한 내용입니다.

출처 : http://hunkim.github.io/ml/

 

모두를 위한 머신러닝/딥러닝 강의

 

hunkim.github.io


강화학습을 사용하여 Frozen Lake 게임을 학습해 보자.

 

S: 시작 지점 / F: 안전한 구역 / H: 위험한 구역(구덩이) / G: 목표 지점

 

Agent는 S에서 시작하여 G로 가는 길을 찾아야 한다.

Agent는 상하좌우로 움직이게 되고 환경에서 현재 상태와 보상을 받게된다.

만약 오른쪽으로 한칸 움직였을 경우 상태는 1, 보상은 0 이 된다.

이 방법을 일반화 하게되면 모든 게임에 적용이 가능하다.

Agent가 행동을 취한다. -> 현재 상태와 보상을 받는다.

 


이를 구현하기 위해 OpenAI에서 제공하는 Gym이라는 라이브러리를 쓴다.

gym.make 로 환경을 만든다.

.reset 으로 환경을 초기화 시킨다.

.render 로 화면에 출력한다.

환경에 따라 적절한 액션을 취하고 .step 함수를 호출하여 결과를 얻어낸다.

 

* done: 게임이 끝났는지, info: 추가정보

 

이를 Frozen Lake에 적용하면 위와 같다.

실제 Agent입장에서는 Enviroment가 보이지 않는다.

어떻게 해결할까?

'공부 기록 > 모두를 위한 딥러닝 (RL)' 카테고리의 다른 글

4-1. Q-learning  (0) 2019.11.19
3-2. Dummy Q-learning 구현  (0) 2019.11.18
3-1. Dummy Q-learning  (0) 2019.11.18
2-2. Playing OpenAI GYM Games  (0) 2019.11.18
1. Reinforcement learning  (0) 2019.11.18
Comments