차시 | 주제 |
---|---|
1 | 나 자신을 표현할 수 있는 문서, 마크다운 |
차시 | 페이지 | 내용 |
---|---|---|
1 | 단단한 심층 강화학습 Ch. 4.1~4.3 | DQN |
2 | 단단한 강화학습 Ch. 1 | 강화학습이란? |
3 | 단단한 강화학습 Ch. 2.1~2.4 | 다중선택문제 |
4 | 단단한 강화학습 Ch. 2.5~2.6 | 다중선택문제 - 긍정적 초깃값 |
5 | 단단한 강화학습 Ch. 2.7~3.1 | 다중선택문제 - 경사도 하강법 |
마르코프 결정 과정 | ||
6 | 단단한 강화학습 Ch. 3.2~3.5 | 벨만 방정식 |
7 | 단단한 강화학습 Ch. 3.6~4.1 | 최적 벨만 방정식 |
반복 정책 평가 | ||
8 | 단단한 강화학습 Ch. 4.2 | 정책 반복 |
9 | 단단한 강화학습 Ch. 4.3~4.8 | 가치 반복 |
3차시: Inverted Pendulum (5/25~7/6)
4차시: Moving Cartpole (7/6~7/27)