문제 유형 (비지도 학습)
비지도 학습은 정답(Label)이 없는 데이터를 가지고 그 안에 숨어있는
구조나 패턴
을 찾아내는 것을 목표로 함.
비지도 학습의 주요 유형
1. 군집화 (Clustering): 비슷한 특성을 가진 데이터끼리
그룹으로 묶는
작업.
목표: 데이터가 어떤 그룹들로 구성되어 있는지 파악.
예시:
고객들을 구매 패턴에 따라 '알뜰 그룹', 'VIP 그룹', '신규 그룹' 등으로 분류.
뉴스 기사를 내용에 따라 '정치', '경제', '스포츠' 그룹으로 자동 분류.
2. 차원 축소 (Dimensionality Reduction): 데이터의
핵심적인 특징은 유지
하면서, 데이터의
변수(차원) 개수를 줄이는
작업.
목표: 데이터를 더 단순하게 표현하여 시각화하거나, 다른 모델의 학습 속도를 높임.
예시: 수십 개의 항목으로 된 고객 만족도 조사 결과를 '가격 만족도', '품질 만족도' 2~3개의 핵심 요소로 요약.
간단한 비유
세탁물을 정리하는 두 가지 방식에 비유할 수 있습니다.
군집화 (Clustering): 빨래 바구니에 섞여있는 옷들을 '흰 옷', '색깔 옷', '수건' 등 비슷한 종류끼리 무더기로 나누는 것과 같다.
차원 축소 (Dimensionality Reduction): 어떤 사람을 표현할 때 “키 180cm, 몸무게 75kg, 상의 사이즈 105, 하의 사이즈 32, 신발 270mm…” 라고 길게 설명하는 대신,
“체격이 좋다”
라고 핵심만 요약해서 말하는 것과 같다.