일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- demultiplexing
- 디바이스 드라이버
- TensorFlow
- 리눅스
- Linux
- 인터럽트
- Switch
- 운영체제
- 스위치
- 3분 딥러닝
- Transport layer
- 신경망 첫걸음
- Class Activation Map
- 텐서플로우
- 모두를 위한 딥러닝]
- 신경망
- Interrupt
- Generalized forward
- 밑바닥부터 시작하는 딥러닝
- Router
- Network layer
- RDT
- LED 제어
- 펌웨어
- LED
- function call
- GPIO
- 모두를 위한 딥러닝
- 딥러닝
- file descriptors
Archives
- Today
- Total
건조젤리의 저장소
1. Reinforcement learning 본문
김성훈 교수님의 강의내용을 정리한 내용입니다.
출처 : http://hunkim.github.io/ml/
모두를 위한 머신러닝/딥러닝 강의
hunkim.github.io
강아지를 훈련시킬 때 보상을 기반으로 한 방법이 효율적이다.
강화학습은 이러한 방법을 사용한다.
우리들이 긍정적인 칭찬과 부정적인 비평에서 배움을 얻듯이 강화학습은 이러한 상호작용으로 학습한다.
Actor는 Enviroment을 관찰하며 행동을 취하고 보상을 받는다.
강화학습은 위와같은 다양한 분야에서 이용이 가능하다.
'공부 기록 > 모두를 위한 딥러닝 (RL)' 카테고리의 다른 글
4-1. Q-learning (0) | 2019.11.19 |
---|---|
3-2. Dummy Q-learning 구현 (0) | 2019.11.18 |
3-1. Dummy Q-learning (0) | 2019.11.18 |
2-2. Playing OpenAI GYM Games (0) | 2019.11.18 |
2-1. Playing OpenAI GYM Games (0) | 2019.11.18 |
Comments