일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- javascript
- wsl
- Event
- 도트
- intervals
- Lerp
- topdown
- classList
- 독립변수
- addEventListener
- click
- 회전
- 도린이
- jQuery
- PYTHON
- Quaternion
- Unity
- className
- 웹스크래핑
- 자주 사용하는 Quaternion 함수
- 연습
- vsCode
- setItem
- getItem
- euler
- 픽셀
- 종속변수
- 코딩
- 탑다운
- 2D
Archives
- Today
- Total
목록예시 (1)
쫑가 과정

강화 학습 (Reinforcement learning) 일단 해보면서 경험을 통해서 실력을 키워가는 것. 지도 학습과의 차이 지도 학습은 배움을 통해서 실력을 키우는 것. 강화 학습은 일단 해보면서 경험을 통해서 실력을 키워가는 것. 작동 원리 행동의 결과가 자신에게 유리한 것이었다면 상을 받고, 불리한 것이었다면 벌을 받는다. 이 과정을 매우 많이 반복하면 더 좋은 답을 찾아낼 수 있다는 것이 강화 학습의 기본 아이디어다. 판단력이 강화되고 그 판단에 따라 행동을 하고 결과가 변화를 일으킨다. 이런 과정을 모방해서 기계를 학습시키는 것이라고 할 수 있다. 게임 -> 환경(enviroment) 게이머 -> 에이전트(agent) 게임 화면 -> 상태(state) 게이머의 조작 -> 행동(action) 상과..
프로그래밍 공부/머신러닝
2021. 7. 28. 10:41