AI 관련 자격증

ADsP 자격증 요약 정리(2) - 1과목 데이터베이스

수진97 2026. 1. 27. 10:29

안녕하세요!

오늘은 ADsP 자격증 1과목 데이터베이스에 대해 살펴보겠습니다.

 

1. 데이터베이스 특징

1) 공용 데이터

- 여러 사용자가 서로 다른 목적으로 데이터를 공용으로 이용

ex. 하나의 고객 DB를 마케팅, 영업, CS부서가 함께 사용

 

 

2) 통합된 데이터

- 동일한 데이터가 중복되지 않도록 통합하여 데이터의 일관성을 유지

ex.고객 정보는 고객 테이블에만 있어야 함. 

 

 

3) 저장된 데이터

- 컴퓨터가 접근 가능한 저장매체에 저장함.(일시적인 데이터 X)

ex. HDD, SSD, DB 서버 등

 

 

4) 변화되는 데이터

- 새로운 데이터의 추가, 기존 데이터 수정 및 삭제처리에도 현재의 데이터를 정확하게 유지하는 무결성의 특징을 가짐

- 항상 최신, 정확한 상태를 유지함

 

ex. 주문 취소, 주소 변경, 신규 가입같이 CRUD 발생 시 DB에 데이터가 바로바로 반영이 됨

 

출처 : https://hongong.hanbit.co.kr/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-databasedb-dbms-sql%EC%9D%98-%EA%B0%9C%EB%85%90/

 

 

 

 

2. 데이터베이스 가치

1) 정보 축적 및 전달 측면

- 기계 가독성 : 시스템이 이해 및 처리 가능

- 검색 가독성 : 빠른 조회와 검색이 가능

- 원격 조작성 : 네트워크 기반으로 원격 접근이 가능

 

 

2) 정보 이용 측면

- 의사결정 지원

- 데이터 분석 및 통계에 활용

- 업무 효율성 향상

 

 

3) 정보 관리 측면

- 데이터 일관성, 무결성, 보안성 확보

-- 중복을 제거하고 접근 권한을 관리

 

 

4) 정보기술 발전 측면

- 데이터베이스 기술 발전

- 빅데이터, AI, 클라우드 기술 기반

 

 

5) 경제/산업 측면

- 데이터 기반 비즈니스 창출

- 산업 경쟁력 강화

- 데이터 자산 가치 증가

 

출처 : https://velog.io/@munsi0405/ADsP-1%EA%B3%BC%EB%AA%A9-%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%9D%98-%EC%9D%B4%ED%95%B4

 

 

 

 

3. 데이터베이스 설계 절차

1) 요구조건 분석

- 사용자 요구사항을 수집하고 분석

- 데이터 대상, 처리 방식, 제약 조건 파악

- 무엇을 저장하고, 어떻게 사용할 것인가를 정의 (요구사항 정의서)

 

2) 개념적 설계 : 개념적 스키마 생성

- 현실세계를 개념적 모델로 표현

- 엔티티, 속성, 관계 정의

- 개념적 스키마 생성 (개념적 ERD)

 

3) 논리적 설계 : 개념적 ERD를 활용한 논리적 모델링

- 개념적 모델을 논리적 데이터 모델로 변환

- 테이블 구조 설계 및 정규화 수행

- 기본키, 외래키 정의

- 개념적 ERD 기반 논리적 모델링 (논리적 스키마 - Relation 구조 설계)

 

(4) 물리적 설계 : 저장 구조 설계

- 실제 저장 방식 설계

- 파일 구조, 인덱스, 저장 공간 설정

- 성능과 접근 경로 고려하여 저장 구조 설계 (물리적 스키마 - 실제 DB 테이블 설계)

출처 : https://trillium.tistory.com/110

 

 

 

 

4. 데이터베이스 시스템

1) DBMS

- DB를 정의, 저장, 관리, 접근할 수 있는 환경을 제공하는 소프트웨어

- 데이터 CRUD 수행, 동시성 제어, 무결성과 보안 및 백업 / 복구 관리

 

- 관계형 RDBMS : 정형화된 데이터를 테이블 형태로 정리(MySQL, MsSQL, Oracle 등)

- NoSQL DBMS : 비정형 데이터 저장 및 처리 (MongoDB, Redis, HBase, CouchDB, Cassandra 등)

 

 

2) DBMS 주요 기능

* SQL : DB에 접근할 수 있도록 지원하는 국제 표준 언어

 

- 데이터 정의(DDL) : 테이블, 뷰, 인덱스 생성 등 (CREATE, ALTER, DROP)

- 데이터 조작(DML) : INSERT, SELECT, UPDATE, DELETE

- 데이터 제어(DCL) : 권한 제어 GRANT, REVOKE + 트랜잭션 제어 COMMIT, ROLLBACK (TCL)

 

 

- 무결성 유지 : 제약조건(PK, FK)

- 보안 : 사용자 권한 관리

- 동시성 제어 : 여러 사용자가 동시에 접근

- 회복 : 장애 발생 시 빠른 복구를 할 수 있도록 함

 

 

3) 데이터베이스 스키마(= DB 설계도)

- 데이터베이스 구조와 제약조건에 대한 전반적인 명세

- 테이블 구조, 칼럼, 관계, 제약조건(PK, FK 등)

 

=> 스키마는 실제 데이터가 아니라 설계 정보를 말함

 

*외부 스키마 : 사용자 관점의 DB 구조 (뷰, 서브 스키마)

*개념 스키마 : DB 전체의 논리적 구조 (ERD)

*내부 스키마 : 물리적 저장 구조 (파일 구조, 인덱스, 저장 위치 등 물리적 구조와 저장 방식, 접근 경로에 포커싱)

 

 

ex. 개념적 설계 단계에서 개념 스키마가 도출됨 (O)

ex. 물리적 설계 단계에서 내부 스키마가 도출됨 (O)

 

 

4) 메타데이터

- 데이터를 설명하는 데이터

- 데이터 구조, 데이터 칼럼 타입, 길이, 제약조건, 테이블 생성일 등

- DB 구조를 이해하고 검색하고 관리하는 데 사용

 

 

 

5) 데이터 사전

- 메타데이터와 데이터 구조 정보를 저장하는 시스템 내 저장소

- 메타데이터를 보관하는 장소로, 사용자가 직접 수정할 수 없음. DBMS가 자동으로 관리

- 메타데이터 ⊂ 데이터 사전

 

 

6)  인덱스

- 정렬과 탐색을 위한 보조 도구로 성능 개선에 중요한 역할

- 실무에서도 항상 인덱스 관리에 신경을 많이 썼음. 사용자는 특히나 서비스 속도에 민감하기 때문에 인덱스를 잘 걸어두어야 함.

- 다시 말해, 데이터 검색 속도를 향상하기 위해 사용하는 자료 구조라고 보면 됨

(SELECT 성능이 올라감 / 반대로 INSERT, UPDATE, DELETE 성능은 감소)

 

 

 

7) 인스턴스

- 특정 시점에 실제로 저장된 데이터 값의 집합

- 타입, 구조 X, '말 그대로 데이터' 를 의미

 

 

 

5. 데이터베이스 활용

기업 내부 활용 데이터베이스

- OLTP : 다량의 단기 거래실시간으로 처리 (현재, 정형, 트랜잭션)

- OLAP : 다차원 데이터를 대화식으로 분석 (과거, 분석, 의사결정 지원)

 

 

 

- ERP : 인사, 회계, 생산 등 기업 내부 자원 통합 관리

- CRM : 고객 관련 데이터를 분석하여 마케팅, 고객 관리에 활용

- SCM : 외부 공급망(조달, 생산, 유통)을 통합 관리 및 최적화

 

=> ERP를 중심으로 SCM과 CRM이 연계됨

 

 

 

- RTE : 실시간 최신 데이터 기반 신속한 의사결정 지원

- KMS : 기업 내 지식, 노하우를 체계적으로 축적 및 공유

- Blockchain : 네트워크 내 모든 참여자들이 정보를 분산 저장하는 분산 원장 기술 => 중앙 관리자가 없음

 

 

 

- BI : 기업 데이터 기반 리포트, 대시보드 중심 분석 시각화 (과거 &현재)

=> 기업의 전략적 의사 결정에 도움을 주는 데이터 분석과 시스템

 

- BA : 통계, 분석 기법을 활용한 비즈니스 인사이트 도출 (미래 지향)

=> 데이터를 분석해서 인사이트를 도출하는 기법/활동

 

 

 

 

6. 데이터 웨어하우스(DW)

- 여러 DBMS의 데이터를 ETL로 추출하고 가공해서 저장

- 의사결정 지원 목적 => 여러 DBMS에서 데이터 가져와 '분석용으로 재구성한 중앙 저장소'

- 기업 내부, 외부의 다양한 데이터를 통합하여 저장하는 중앙 집중형 저장소

출처 : https://bomwo.cc/posts/Datawarehouse/



 

1) 구성요소

* ETL(실시간 X, 주기적으로 DW로 들어오는 관문)

 

- Extraction : 다양한 소스(DB, 로그 등) 에서 데이터를 추출

- Transform : 데이터 정제, 가공, 변환

- Load : DW에 적재

 

 

*ODS(Operational Data Store)

- 여러 DBMS에서 추출한 데이터를 임시로 저장

- DW 적재 전 중간 저장소

- 실시간 / 근실시간 데이터 처리 가능

 

 

 

2) DW 특징

- 주제중심 : 분석 목적 중심으로 구성 (실시간으로 변경되는 업무 중심이 아니라, 분석과 의사결정에 포커스를 둔 주제 중심)

- 데이터 통합 : 일관된 형식으로 통합하고 저장함.

- 시계열성 : 과거부터 현재까지의 히스토리를 보존함.

- 비휘발성 : 읽기 전용으로, 자주 변경되지 않음
- 스키마 온 Write : 데이터를 저장할 때 스키마를 미리 적용하는 방식

 

 

=> 실시간 갱신 X, OLTP X : DW는 OLAP 의 성격

 

 

 

7. 데이터 레이크(DataLake)

- 정형, 반정형, 비정형 데이터를 원형 그대로 저장하는 대용량 저장소

- 비정형 데이터를 저장하며 하둡과 연계하여 처리

- 스키마 선적용 하지 않기 때문에 유연성이 높음

- 빅데이터 분석이나 AI/ML에 활용됨
- 스키마 온 Read : 데이터를 저장할 때는 구조를 정하지 않고, 읽을 때(분석할 때) 스키마를 적용하는 방식

 

 

* 하둡(Hadoop)

- 여러 컴퓨터를 하나의 시스템처럼 묶어 대용량 데이터를 처리하는 오픈 소스 빅데이터 솔루션

- 전에 학부시절, 빅데이터 관련 수업 들었었는데, 그때 하둡 배웠던 게 기억남.

한 가지 확실한 건 MapReduce 처리가 로우 레벨의 프로그래밍에 가깝다 보니 개발 난도가 높아 쉽지 않았던 걸로 기억함...

 

 

- HDFS : 분산형 파일 저장 시스템(대용량 데이터 저장)

- MapReduce : 분산된 데이터를 병렬로 처리(Map -> Reduce 단계로 처리함)