728x90
반응형
SMALL
1. 분석결과 해석
1.1 주성분 분석 (PCA)
- 고차원 데이터를 저차원 공간으로 변환해 핵심 정보만 추출
| 항목 | 설명 |
| 주성분의 정의 | 분산을 최대한 보존하는 새로운 축 (주성분: 선형 결합) |
| 분산 기준 | 첫 번째 주성분이 데이터의 분산을 가장 많이 설명 |
| 주성분 개수 선택 | Scree Plot에서 기울기 급감 이후 지점(Elbow point)까지 선택 |
| 누적 설명력 | 보통 누적 설명력 70~90% 이상 확보 시 주성분 개수 결정 |
- 주성분에 포함된 변수의 가중치를 분석하면 어떤 요소가 영향력이 큰지 파악 가능
- 시각화 시, 2D 주성분 좌표계로 군집 또는 이상치 탐색에도 활용 가능
1.2 회귀분석의 분산분석 (ANOVA) 해석
| 항목 | 설명 |
| 목적 | 전체 회귀 모형이 통계적으로 유의한지 판단 |
| 주요 수치 | F-통계량과 p-value (모형 전체 유의성 판단 지표) |
| 결정계수 (R²) | SSR / SST : 설명력 비율 (0~1) |
| 수정된 R² | 변수 수 증가로 인한 R² 과대평가를 보정한 값 |
| 회귀계수 t-test | 각 변수의 독립적 유의성 검정 (p-value < 0.05 기준) |
| 자유도 | 총 n개의 데이터 → 자유도 = n - 변수 수 - 1 |
📌 해석
- F 통계량 유의 → 모델 전체 적합
- t 검정 유의 → 각 변수 적합
- R² 높음 → 설명력 충분
- R² 값이 높지만, 수정 R²는 낮은 경우 → 과적합 또는 불필요 변수 존재 가능성
- 특정 변수 t-검정 p-value > 0.05 → 제거 고려
1.3 비즈니스 기여도 평가
| 구분 | 주요 내용 |
| 재무적 평가 지표 | ROI(투자 대비 효과), NPV(순현재가치), IRR(내부수익률), TCO(총 소유 비용) |
| 비재무적 지표 | KPI 달성률, 업무 자동화율, 고객 만족도, 프로세스 개선 효과 |
| 기여도 평가 프로세스 | 분석 목표 설정 → 성과 지표(KPI) 선정 → 데이터 분석 → 성과 평가 & 피드백 |
- ROI 계산 시는 정확한 투입·산출 정량화가 중요
- 고객 세그먼트 분석 → 타깃 마케팅 → KPI 개선 → ROI 상승
- 분석 성과는 기술적 정확도 + 비즈니스 적용력 함께 해석해야 진짜 가치 있음
2. 분석결과 시각화
2.1 시공간 시각화 (Time & Spatial Visualization)
| 구분 | 설명 | 대표 시각화 | 특징 |
| 시간 시각화 | 시간 흐름에 따른 데이터 변화 추이 시각화 | 라인차트, 시계열 차트, 캘린더 히트맵 | 추세, 계절성, 주기성 파악에 유용 |
| 공간 시각화 | 지리적 분포를 공간 기반으로 표현 | 지도(Map), Geo Plot | 지역 간 비교 및 위치 기반 인사이트 도출 |
✅ 시간 시각화 유형
- 라인차트
- 시간에 따른 연속 데이터의 흐름 표현
- 일별 방문자 수, 일매출 추이

- 시계열 분해 그래프
- 추세, 계절성, 잔차를 분리하여 시간 요소별 영향 분석
- 매출 시계열에서 계절 요인 분리 분석

- 캘린더 히트맵
- 요일/날짜별 데이터의 밀도를 달력 형태로 시각화
- 월간 접속량, 주간 이탈률 시각화

✅ 공간 시각화 유형
- 등치지역도 (Choropleth Map)
- 값의 크기를 색의 농도로 표현
- 지역별 확진자 수, 인구 밀도

- 카토그램 (Cartogram)
- 데이터값에 따라 지리적 크기를 왜곡하여 강조
- 총선 결과, GDP 등

- 버블 맵 (Bubble Map)
- 위치 위에 원 크기로 값 표현
- 대도시별 소비량, 사고 발생

2.2 관계 시각화 (Relational Visualization)
- 버블차트
- X축, Y축 + 원 크기 = 3변수 시각화
- 정보량 多, 겹치면 해석 어려움

- 히트맵
- 색상의 강약으로 관계 또는 상관정도 표현
- 상관행렬 분석, 유전자 발현 등

- 트리맵
- 계층 구조 + 비율 시각화 (면적 기반)
- 부서별 매출 기여도 등

2.3 비교 시각화 (Comparison Visualization)
- 체르노프 페이스
- 변수들을 얼굴 표정 요소로 시각화
- 사람의 얼굴로 직관적 인식 가능
- 스타차트 (Radar Chart)
- 방사형으로 여러 변수 비교
- 균형성, 강점/약점 시각화

- 평행좌표 차트
- 다변량 데이터 간 패턴 시각화
- 선의 흐름으로 군집 확인 용이

2.4 인포그래픽 (Infographics)
| 항목 | 설명 |
| 목적 | 일반인에게 정보를 쉽게 전달하고 메시지를 설득력 있게 시각화 |
| 특징 | 원 데이터보다는 요약, 패턴보다는 메시지 중심 전달 |
| 주요 유형 | 지도형 / 도표형 / 타임라인형 / 스토리텔링형 / 만화형 / 비교형 / 컨셉맵 |
| 핵심 원리 | 단순성, 명확성, 일관성, 가독성, 효과성, 오컴의 면도날 적용 |

📌 Note
인포그래픽은 분석가의 도구라기보다는 보고용/홍보용 콘텐츠로 활용되며,
데이터 해석보다는 요약과 전달 목적이 강함
3. 분석결과 활용 (Application of Analytical Results)
3.1 분석모형 전개 (Model Deployment)
| 항목 | 설명 | 예시 |
| 모형 적용 | 분석된 모델을 실제 비즈니스 프로세스에 적용 | 예측모델을 CRM에 적용해 고객 이탈 예측 |
| 자동화 연계 | 시스템과 연동해 자동화된 의사결정 구현 | 머신러닝 모델을 API로 배포해 실시간 예측 |
✅ 예: 신용카드 이상 거래 탐지 모델 → 실시간 결제 차단 시스템 연동
3.2 분석 시나리오 개발 (Scenario Development)
| 항목 | 설명 | 예시 |
| 업무 시나리오화 | 분석결과를 실제 업무 흐름과 연결 | 고객이탈 예측 결과 → 상담 우선순위 배정 |
| 자동 대응 설계 | 데이터 기반 조건부 액션 플로우 설계 | 재구매 확률 높은 고객 자동 메시지 발송 |
✅ 예: 고객의 행동패턴 변화 감지 → 자동 쿠폰 발송
3.3 인사이트 발굴 (Insight Discovery)
| 항목 | 설명 | 예시 |
| 패턴 탐지 | 데이터에 숨겨진 반복 규칙 또는 연관관계 탐색 | 특정 시간대에 장바구니 수 증가 → 해당 시간대 세일 적용 전략 |
| 이상 탐지 | 평균과 크게 벗어난 예외 데이터 탐지 → 리스크 관리 | 거래 이상 급증 고객 → 이상거래 감지 및 알림 |
| 변수 중요도 해석 | 예측 결과에 영향을 미치는 핵심 요인 파악 | 고객 이탈 예측 시 ‘최근 접속일’이 가장 영향력 있는 변수로 확인 |
✅ 예: 이탈 예측 모델에서 '최근 접속일'이 핵심 변수 → 앱 푸시로 접속 유도 전략 수립
728x90
반응형
LIST