쫑가 과정

강화 학습 본문

프로그래밍 공부/머신러닝

강화 학습

쫑가 2021. 7. 28. 10:41

강화 학습 (Reinforcement learning)

일단 해보면서 경험을 통해서 실력을 키워가는 것.

 

지도 학습과의 차이

지도 학습은 배움을 통해서 실력을 키우는 것.

강화 학습은 일단 해보면서 경험을 통해서 실력을 키워가는 것.

작동 원리

행동의 결과가 자신에게 유리한 것이었다면 상을 받고, 불리한 것이었다면 벌을 받는다.

과정을 매우 많이 반복하면 더 좋은 답을 찾아낼 수 있다는 것이 강화 학습의 기본 아이디어다.

판단력이 강화되고 그 판단에 따라 행동을 하고 결과가 변화를 일으킨다.

이런 과정을 모방해서 기계를 학습시키는 것이라고 할 수 있다.

게임 -> 환경(enviroment)

게이머 -> 에이전트(agent)

게임 화면 -> 상태(state)

게이머의 조작 -> 행동(action)

상과 벌 -> 보상(reward)

게이머의 판단력 -> 정책(policy)

 

강화 학습은 더 많은 보상(reward)을 받을 수 있는 정책(policy)을 만드는 것이 핵심이다.

이렇게 만들어진 정책은 인공지능 플레이어를 만드는 데 사용될 수 있다.

알파고나 자율주행 기능 등.

사례.

 

머신러닝 1 - 강화학습의 사례 (Responses)

Form Responses 1 Timestamp,URL,설명,데이터를 만드는 방법 8/19/2020 2:37:36,https://www.youtube.com/watch?v=OAaEg-P7V54,설명 : 인공지능에게 공굴리기 학습을 시켜보는것

docs.google.com

'프로그래밍 공부 > 머신러닝' 카테고리의 다른 글

비지도 학습(군집화, 연관, 변환)  (0) 2021.07.28
지도학습(회귀, 분류)  (0) 2021.07.28
지도 학습, 비지도 학습, 강화 학습  (0) 2021.07.27
독립변수, 종속변수  (0) 2021.07.27
  (0) 2021.07.27
머신러닝 야학 3기  (0) 2021.07.24
Comments