AI 관련 자격증

ADsP 자격증 요약 정리(1) - 1과목 데이터 이해

수진97 2026. 1. 25. 21:19

안녕하세요!

오늘 포스팅은 ADsP 자격증 1과목 요약본을 정리해보려고 합니다.

저번 AICE Associate 자격증에 이어 이번에 ADSP 자격증도 도전해보려고 하는데요.

2번째 AI 자격증 도전인데, 빅프로젝트와 병행하는 도전인 만큼 쉽지는 않겠지만 이번에도 열심히 준비해보려고 합니다 ㅎㅎ

 

 

 

1. 데이터의 이해

1. 데이터의 정의

1) 데이터 : 가공되지 않은 상태로 있는 그대로의 객관적인 사실

- 존재적 특성 : 데이터는 현실 그대로를 반영함

- 당위적 특성 : 데이터는 추론·예측·전망·추정을 위한 근거로, 맥락 속에 의미를 부여할 수 있음

 

 

2) 정보 : 데이터로부터 가공된 자료

 

 

 

 

2. DIKW 피라미드

데이터(Data) -> 정보(Information) -> 지식(Knowledge) -> 지혜(Wisdom)

 

1) Data : 가공 전 객관적 사실로써, 단순 사실이나 수치를 의미

ex. A학생 65점, B학생 95점

 

2) Information : 데이터를 통해 패턴을 인식하고, 데이터를 구조화하여 연관관계 및 의미도출

ex. 평균 점수는 80점. A학생보다 B학생의 점수가 30점 더 높다.

 

3) Knowledge : 패턴을 바탕으로 경험과 학습을 통해 의사결정에 활용하는 것

ex. A학생은 평균보다 점수가 낮기 때문에 해당 과목의 보충수업을 진행해야 한다.

 

4) Wisdom : 지식을 바탕으로 통찰을 얻고, 창의적인 전략으로 미래를 예측하거나 결정

ex. 평균보다 낮은 점수의 학생들은 보충 수업, 평균보다 높은 점수의 학생들은 심화 수업을 진행하면,

다음 시험의 평균은 87점 이상 나올 것이다.

출처 : https://star7sss.tistory.com/1034

 

 

 

3. 데이터의 유형

1) 형태에 따른 분류

- 정형 데이터 : 행과 열로 구성된 구조화된 데이터 (고정된 스키마 형식)  ex. 엑셀 표, DB 테이블

- 비정형 데이터 : 구조화되지 않은 자유로운 형태의 데이터(구조 X)   ex.일반 SNS 텍스트, 이미지 등

- 반정형 데이터 : 데이터를 설명하는 메타데이터를 포함하는 데이터 (구조 O BUT 고정된 테이블은 X)

=> 스키마가 느슨한 구조로 되어 있어서 NoSQL에 사용. 예시로는 JSON, XML, HTML 등

 

 

 

2) 분석 목적에 따른 분류

- 수치형 : 이산형(1,2,3... 개수를 셀 수 있음) / 연속형(1.1, 1.11, 1.1111..... 무수히 많은 중간값 존재)

- 범주형 : 명목형(순서 없음. 성별, 혈액형, 거주 지역) / 순서형(학점 B <  A, 등급 Bronze < Silver < Gold)

 

*주의

매출액 => 연속형

나이 => 연속형

시간 => 연속형

 

설문 점수 1~5점 => 숫자지만 순서형의 범주 데이터

우편번호 => 숫자지만 명목형의 범주 데이터

고객 등급도 서열형 범주 데이터라 평균을 내면 해석이 왜곡될 수 있음

 

 

 

3) 표현 방식에 따른 분류

- 정량적 데이터 : 측정, 계산이 가능한 수치로 측정된 데이터 (수치형 데이터)

- 정성적 데이터 : 수치보다 의미, 속성, 분류가 더 중요한 데이터로 자료의 특징을 풀어 설명(범주형 데이터)

 

 

 

 

4. 암묵지, 형식지

1) 암묵지

- 말이나 문서로 표현하기 어려운 지식, 개인에게 암묵적으로 습득되고 겉으로 드러나지 않는 지식

- 사람 머릿속에 있는 지식으로 개인의 경험, 노하우가 담김

 

ex. 숙련자의 감각, 장인의 손기술, 베테랑 개발자의 디버깅 감

 

 

 

2) 형식지

- 문서, 매뉴얼로 표현 가능한 형상화된 지식

- 문서화, 표준화된 지식(매뉴얼 / 문서 / 규칙을 공유, 전달, 자산화 가능)

 

ex. 업무 매뉴얼, 교재, DB

 

 

 

* SECI 모델

공통화 : 암묵지 지식을 다른 사람에게 전함으로써 경험을 공유함 (암묵 -> 암묵)

표출화 : 암묵지 지식을 문서화 (암묵 -> 형식)

연결화 : 매뉴얼에 새로운 지식 추가 (형식 -> 형식)

내면화 : 만들어진 매뉴얼에서 다른 사람의 암묵지를 터득 (형식 -> 암묵)