728x90
반응형
SMALL

pca 2

[빅데이터분석기사] 빅데이터 결과 해석 - 분석결과 해석 및 활용

1. 분석결과 해석1.1 주성분 분석 (PCA)고차원 데이터를 저차원 공간으로 변환해 핵심 정보만 추출 항목   설명 주성분의 정의분산을 최대한 보존하는 새로운 축 (주성분: 선형 결합)분산 기준첫 번째 주성분이 데이터의 분산을 가장 많이 설명주성분 개수 선택Scree Plot에서 기울기 급감 이후 지점(Elbow point)까지 선택누적 설명력보통 누적 설명력 70~90% 이상 확보 시 주성분 개수 결정주성분에 포함된 변수의 가중치를 분석하면 어떤 요소가 영향력이 큰지 파악 가능시각화 시, 2D 주성분 좌표계로 군집 또는 이상치 탐색에도 활용 가능 1.2 회귀분석의 분산분석 (ANOVA) 해석 항목  설명 목적전체 회귀 모형이 통계적으로 유의한지 판단주요 수치F-통계량과 p-value (모형 전체 ..

[빅데이터분석기사] 빅데이터 탐색 - 데이터 탐색

데이터 탐색1. 데이터 탐색 기초1.1 EDA (Exploratory Data Analysis, 탐색적 자료 분석)EDA는 데이터의 숨겨진 의미를 찾기 위해 통계적 방법과 시각화를 활용하는 탐색적 분석 기법EDA의 4대 주제저항성의 강조잔차 계산자료변수의 재표현그래프를 통한 현시성2. 상관관계 분석 구분  설명  활용 상황 피어슨 상관분석연속형 수치형 변수 간의 선형 관계 측정키-몸무게, 공부시간-점수스피어만 상관분석서열/순서형 변수의 상관성, 비선형도 가능등수-만족도 등 서열형 자료💡 상관계수 r+1: 완전 양의 상관0: 무상관–1: 완전 음의 상관3. 기초 통계량 이해 지표  설명 평균값들의 총합 ÷ 개수중앙값정렬했을 때 중앙에 있는 값최빈값가장 자주 등장한 값분산값들이 평균에서 얼마나 떨어져..

728x90
반응형
LIST