쫑가 과정

비지도 학습(군집화, 연관, 변환) 본문

프로그래밍 공부/머신러닝

비지도 학습(군집화, 연관, 변환)

쫑가 2021. 7. 28. 10:20

비지도 학습 (Unsupervised learning)

 

비지도 학습 - 생활코딩

군집화  연관규칙학습 비지도 학습 정리 비지도 학습의 사례로는 ‘군집화’와 ‘연관규칙’이라는 것이 있습니다. 어려워 보이지만 알고 보면 사실 별 것 아닙니다. 아래 그림을 5분만 유심히

opentutorials.org

지도 학습과 차이점

지도 학습은 역사적.

과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때

그것은 어떤 결과를 초래할 것인가를 추측하는 것이 목적.

원인인 독립변수와 결과인 종속변수가 꼭 필요하다.

 

비지도 학습은 탐험적.

데이터들의 성격을 파악하는 것이 목적.

독립 변수와 종속변수의 구분이 중요하지 않다. 데이터만 있으면 된다.

비지도 학습이란?

비지도 학습을 한마디로 정의하는 것은 어려운 일이다.

데이터의 성격을 파악하는 작업은 비슷한 것은 모으고 다른 것은 떨어뜨리는 것이다. 즉 그룹핑을 하는 것.

데이터를 정리 정돈해서 그 표에 담긴 데이터의 성격을 파악하는 것이 중요한 목적.

군집화, 연관 규칙

비지도 학습의 사례로는

군집화와 연관 규칙이라는 것이 있다

군집화 (Clustering)

비슷한 것들을 찾아서 그룹을 만드는 것

분류와의 차이

분류

그룹을 만들고 난 후에 각각의 물건을 적당한 그룹에 위치시키는 것.

어떤 대상이 어떤 그룹에 속하는지를 판단하는 것.

 

군집화

비슷한 것들끼리 모아서 적당한 그룹을 만드는 것.

어떤 대상들을 구분해서 그룹을 만든다.

작동원리

표의 숫자만 보고 군집화를 하는 것은 쉽지 않을 것이다.

이때 사용하는 것이 좌표평면이다.

그림으로 표현하니까 훨씬 보기 좋다.

가까운 것들끼리 묶으면 된다.

 

군집화라는 도구에 관측치(행)를 입력하고 100개의 클러스터가 필요하다고 알려주면

유사한 속성을 가진 관측치(행)끼리 분류해 총 100개의 클러스터를 만들어 준다.

결과를 표로 나타낸다면

비슷한 그룹핑하는 것이 군집화

연관 규칙 학습 (Association)

서로 연관된 특징찾아내는 것. 일명 장바구니 분석.

고객의 장바구니에 담긴 상품을 바탕으로 관심을 가질만한 상품을 추천하면 더 많이 판매할 수 있지 않을까?

쇼핑 추천, 음악 추천, 영화 추천, 검색어 추천 등

추천이 이름 뒤에 붙은 것들은 거의 다 연관 규칙을 이용한 것이라고 보면 된다.

연관 규칙은 서로 관련이 있는 특성(열)을 찾아주는 머신러닝의 기법이라는 것을 알 수 있다.

군집화와 연관규칙

군집화    -> 관측치(행)를 그룹핑

연관규칙 -> 특성(열)을 그룹핑

변환(Unsupervised transformation)

 

Supervised and Unsupervised Learning

SUPERVISED LEARNING Supervised Learning is used whenever we want to predict a certain outc...

dev.to

비지도 변환데이터의 원래 표현과 비교하여 인간이나 다른 기계 학습 알고리즘이 더 쉽게 이해할 수 있는 데이터의 새로운 표현을 생성하는 알고리즘이다.

일반적인 응용

많은 특징으로 구성된 데이터의 고차원 표현을 받아서

더 적은 특징으로 필수 특성을 요약하는 데이터로 변환하는 차원 축소에 사용된다.

예 - 시각화를 위해 2_d로 줄입니다.

'프로그래밍 공부 > 머신러닝' 카테고리의 다른 글

강화 학습  (0) 2021.07.28
지도학습(회귀, 분류)  (0) 2021.07.28
지도 학습, 비지도 학습, 강화 학습  (0) 2021.07.27
독립변수, 종속변수  (0) 2021.07.27
  (0) 2021.07.27
머신러닝 야학 3기  (0) 2021.07.24
Comments