'예시' 태그의 글 목록

Notice

나에 대하여 7.19

Recent Posts

Recent Comments

Link

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

관리 메뉴

목록예시 (1)

쫑가 과정

강화 학습

강화 학습 (Reinforcement learning) 일단 해보면서 경험을 통해서 실력을 키워가는 것. 지도 학습과의 차이 지도 학습은 배움을 통해서 실력을 키우는 것. 강화 학습은 일단 해보면서 경험을 통해서 실력을 키워가는 것. 작동 원리 행동의 결과가 자신에게 유리한 것이었다면 상을 받고, 불리한 것이었다면 벌을 받는다. 이 과정을 매우 많이 반복하면 더 좋은 답을 찾아낼 수 있다는 것이 강화 학습의 기본 아이디어다. 판단력이 강화되고 그 판단에 따라 행동을 하고 결과가 변화를 일으킨다. 이런 과정을 모방해서 기계를 학습시키는 것이라고 할 수 있다. 게임 -> 환경(enviroment) 게이머 -> 에이전트(agent) 게임 화면 -> 상태(state) 게이머의 조작 -> 행동(action) 상과..

프로그래밍 공부/머신러닝 2021. 7. 28. 10:41

Prev 1 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

쫑가 과정

목록예시 (1)

쫑가 과정

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역