일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Linux
- Class Activation Map
- Generalized forward
- 신경망
- 운영체제
- Transport layer
- TensorFlow
- 모두를 위한 딥러닝
- 3분 딥러닝
- Router
- LED
- function call
- 리눅스
- GPIO
- 딥러닝
- Switch
- 밑바닥부터 시작하는 딥러닝
- 텐서플로우
- 신경망 첫걸음
- RDT
- demultiplexing
- file descriptors
- 스위치
- 모두를 위한 딥러닝]
- 펌웨어
- Interrupt
- LED 제어
- Network layer
- 인터럽트
- 디바이스 드라이버
Archives
- Today
- Total
목록모두를 위한 딥러닝] (1)
건조젤리의 저장소
4-2. Q-learning 구현 (table)
김성훈 교수님의 강의내용을 정리한 내용입니다. 출처 : http://hunkim.github.io/ml/ 모두를 위한 머신러닝/딥러닝 강의 hunkim.github.io 지난 강의에서 설명한 알고리즘을 구현해보자! 그대로 구현하면 된다! * env.action_sapce.sample(): 랜덤한 행동을 한다. 노이즈 값을 추가하는 방법의 구현 dis는 1보다 작은 값으로 설정한다. 결과가 잘 나오는 것을 확인! e-greedy방법으로 확인해 보자! 이전의 노이즈 값 추가 방법보다 더 다양한 길을 찾아냈다. 구현 코드 (환경: ubuntu:16.04 python 3.6) Exploit vs Exploration 방법 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20..
공부 기록/모두를 위한 딥러닝 (RL)
2019. 11. 19. 17:04