2022/11 3

[데이터 분석] 확률 & 베이즈 정리 (3)

◼︎ 확률 - 전체 중에서 나온 비율 - 0~1 사이의 값 - 확률의 합 = 1 ◼︎ 확률 실험(E) 다음 3가지를 만족 1) 결과는 알 수 없음 2) 결과로 나타날 수 있는 가능한 경우들은 알고 있음 3) 동일한 실험을 반복할 수 있음 ◼︎ 표본공간(S) 확률실험으로 출현 가능한 모든 결과들의 모임 S = {H, T} 동전 던지기 ◼︎ 사건 표본공간의 각 원소들의 부분집합 ex) {H}, {T} 사건의 연산 : 합사건, 곱사건, 여사건, 배반사건, 독립사건 배반사건 : 두 사건이 겹치는 부분이 없는 즉, 동시에 발생하지 않는 사건 (여사건 X) 독립사건 : 두 사건이 서로의 발생에 영향을 끼치지 않는 사건 ◼︎ 베이즈 정리 (Bayes' theorem)​ 0) 베이즈 정리 공식 1) 조건부 확률 A가 ..

데이터 분석 2022.11.10

[데이터 분석] 데이터 시각화 도구 및 특징 (2)

◼︎ 자료 정리 방법 분할표(contingency table), 교차표(cross tabulation) - 두 개 이상의 변수를 동시에 고려하여 관측개체의 빈도 정리 질적(범주형) 자료 - 도수분포표, 막대그래프(Bar chart), 원형그래프(Pie chart)등 양적(수치형) 자료 - 도수분포표, 히스토그램(Histogram), 상자그림(Box plot), 산점도(Scatter plot)등 ◼︎ 차트 일변량 차트 (Univariate Charts) : 변수 1개 - 범주형 : 원형그래프(Pie chart) - 수치형 : 히스토그램, 상자그림(Box plot) 다변량 차트(Bivariate Chart) : 변수 2개 이상- 범주형&수치형 : 상자그림(Box plot), 막대그래프(Bar Chart) -..

데이터 분석 2022.11.10

[데이터 분석] 통계 기본 용어 개념 및 데이터 종류 (1)

◼︎ 통계 기본 용어 모집단(Population) : 통계분석 방법을 적용할 관심 대상의 전체 집합 모수(Parameters) : 모집단을 분석하여 얻어지는 결과 수치 표본(Sample) : 직접적인 조사 대상이 된 모집단의 일부 통계량(Statistics) : 표본을 분석하여 얻어지는 결과 수치 ◼︎ (기술)통계량 의 종류 1-1) 평균(Mean) 분산의 계산, 모수 추정, 가설 검증 등 통계 분석의 대표적인 값으로 널리 사용됨 극단적인 값(이상치)에 민감하여, 자료의 수가 적고 극단 값이 여러 개인 경우 대푯값의 기능을 상실 1-2) 기대값 E(X) 평균이 수치형 데이터에 대한 대표값이라면, 기대값은 모르는 데이터에 대한 평균값이라 할 수 있음 2) 중앙값(Median) = 중위수 데이터를 순서대로 ..

데이터 분석 2022.11.10