ADsP 3과목 이어서 포스팅해 보겠습니다.

1. 추론통계
- 표본으로부터 모집단의 특성을 추정하거나 가설을 검정하는 통계 기법

(1) 표본추출 방법
1) 랜덤 추출법(단순 무작위)
- 모든 개체가 동일한 확률
2) 계통 추출법
- 번호 부여 -> 일정 간격(k)으로 추출
ex. 1, 11, 21, 31...
3) 집락 추출법 (= 군집 추출)
- 모집단을 여러 군집으로 나눈 후 군집 자체를 선택해서 전부 또는 랜덤 일부를 조사
- 작은 모집단을 통째로 뽑자
- 군집 내 이질적 / 군집 간 동질적
ex. 학교 몇 개를 뽑아서 그 학교 학생 전부 조사
(학교 내에는 1학년, 2학년... 남학생, 여학생 모두 섞여 있어서 이질적임)
(하지만 A학교도 학생 구성 다양 / 다른 군집인 B학교도 다양 => 비슷한 구조)
4) 층화 추출법
- 모집단을 층으로 나눈 후 각 층에서 표본 추출
- 비슷한 애들끼리 묶어 놓고 -> 각 묶음에서 조금씩 뽑자
- 층 내 동질적 / 층 간 이질적
ex. 성별, 연령대 별로 비율 맞춰 추출
* 비례 층화 추출 : 모집단 비율과 같은 비율로 추출
5) 복원 / 비복원 추출
- 복원 추출 : 뽑은 후 다시 넣음 (확률 동일)
- 비복원 추출 : 한 번 뽑히면 제외
2. 확률 분포
- 확률 변수의 개별 값들이 가지는 확률 값의 분포
(1) 이산 확률분포
- 값을 셀 수 있는 분포(횟수 / 개수), 확률질량함수로 표현
- 이항분포의 최소 단위
- 베르누이 -> 이항 -> 다항(확장)
- 기하 -> 음이항(성공까지)
1) 베르누이 분포
- 한 번의 시행 : 성공확률 p
- 결과 : 성공 / 실패 (2가지) => 결과가 2가지 중 한 가지로 나타남
ex. 동전 앞 / 뒤, 합격 / 불합격
2) 이항분포
- N번의 베르누이 시행 중 K번 성공할 확률분포
- 성공 횟수 K의 분포
- 조건 : 독립 시행, 성공확률 p 동일, 복원추출
ex. 동전 10번 던져 뒷면이 나올 횟수
* 이산 균등분포 : 각 값의 확률이 모두 같다 (평균 = (최솟값 + 최댓값) / 2)
* 이항분포 : 각 시행의 성공 확률 p가 같을 뿐, n번 시행 중 성공 횟 확률은 다름 (평균 = np)
~의 개수 -> 이항분포
동일 확률 -> 균등분포
3) 기하분포
- 성공확률이 p인 베르누이 시행에서 처음으로 1번 성공할 때까지의 시행 횟수
- 기억성질을 가짐.
ex. 동전을 던져 처음으로 뒷면이 나오기까지 던진 횟수
4) 음이항 분포
-성공확률이 p인 베르누이 시행을 r번 성공할 때까지 반복 시행 횟수
- 기하분포의 일반화
ex. 동전을 던져 뒷면이 3번 나올 때까지 던진 횟수
5) 초기하 분포
- N개 중 비복원 추출로 n번 추출했을 때 원하는 결과가 k번 나올 확률
- 모집단 크기 N 고정 / 성공 개수도 고정
ex. 20개 사탕 중 콜라맛 사탕 5개, 5번 뽑았을 때, 콜라맛 사탕이 2개 뽑을 확률
6) 다항분포
- N번 시행에서 각 시행이 여러 개의 결과를 가질 수 있는 확률 분포
- 이항분포의 확장
ex. 주사위를 10번 던져 각 면이 나오는 횟수
7) 포아송 분포
- 단위 시간 내 발생할 수 있는 사건의 발생 횟수
ex. 하루동안 교통사고 발생 건수, 한 시간 전화 수

(2) 연속 확률분포
- 확률 변수가 연속값(시간 / 길이 / 비율) -> 확률 밀도 함수로 표현
- 값을 셀 수 없는 분포
1) 균일 분포
- 구간 내 모든 값이 동일한 밀도(= 모든 값 동일 확률)
ex. 특정 구간에서 무작위 시간 선택
2) 정규 분포
- 자연현상, 연속적인 측정값, 종 모양의 우리가 일상생활에서 보는 확률변수의 평균 분포를 근사한 분포
- 평균 μ, 분산 σ²
3) t분포
- 정규분포와 유사하나 꼬리가 더 두껍고 긺
- 표본 수 작을 때 사용
- 자유도 = n - 1 (표본 크기 = n)
* t-검정 : 표본이 30개보다 작은 집단에 대한 평균 검정 (표본수가 작으면 정규분포 쓰기는 애매해서)
ex. 표본 수가 20개이고 모분산을 모르는 경우, 평균에 대한 검정을 수행하려 할 때 t-분포 사용
(평균 검정이란 어떤 집단의 평균이 특정 값인지, 또는 두 집단의 평균이 같은지 확인)


4) 카이제곱분포
- 독립적인 정규분포를 따르는 변수들의 제곱 합
- 항상 0 이상, 비대칭, 범주형
* 카이제곱 검정 활용 : 두 집단의 동질성 검정, 단일 집단의 모분산 검정
=> 독립성, 동질성, 모분산 검정
ex. 두 범주형 변수 간의 관련성을 검정하고자 사용하는 검정 = 카이제곱 독립성 검정

5) F분포
- 두 개의 서로 다른 카이제곱 분포의 비율 (분산 비교)
- 항상 양수
*F검정: 두 집단의 분산 동질성 검정, 분산분석(ANOVA)

6) 지수분포
- 사건 간 시간 간격 분포
- 기억성질 있음
ex. 다음 전화까지 걸리는 시간
7) 감마분포
- 지수분포의 일반화
- 여러 사건까지의 시간
8) 베타분포
- 두 모수 알파, 베타에 대한 0~1 사이 비율 분포
ex. 성공확률 p의 분포
ex. 클릭률, 전환율
* 중심 극한 정리
- 임의의 모집단으로부터 추출된 표본 분포는 표본 크기가 30개 이상이면 정규분포
- 모집단의 분포에 상관없이 표본평균분포가 정규분포를 이룸
'AI 관련 자격증' 카테고리의 다른 글
| ADsP 자격증 요약 정리(9) - 3과목 R 기초 통계량(기초 통계) (0) | 2026.02.05 |
|---|---|
| ADsP 자격증 요약 정리(8) - 3과목 R기초 확률 / 통계 개념 (0) | 2026.02.05 |
| ADsP 자격증 요약 정리(7) - 3과목 R기초 EDA와 DM (0) | 2026.02.04 |
| ADsP 자격증 요약 정리(6) - 2과목 분석 마스터 플랜 (1) | 2026.02.04 |
| ADsP 자격증 요약 정리(5) - 2과목 데이터 분석 과제 (1) | 2026.02.04 |