데이터베이스 정규화와 반정규화
요약
정보처리기사 시험의 핵심 개념인 데이터베이스 정규화(Normalization)의 모든 것을 알아봅니다. 1NF부터 5NF까지 각 정규형의 개념과 조건, 그리고 반정규화의 개념까지 예제와 함께 쉽게 설명하고 실기 대비 문제로 마무리합니다.
데이터베이스 정규화란?
정규화(Normalization) 는 관계형 데이터베이스에서 데이터의 중복을 최소화하고, 데이터 무결성을 보장하기 위해 테이블 구조를 체계적으로 분해하는 과정입니다. 정규화를 통해 이상 현상(Anomaly)을 방지하고, 데이터 구조의 안정성과 유지보수성을 향상시킬 수 있습니다.

정규화 단계 요약
| 정규형 | 핵심 조건 | 제거 대상 |
|---|---|---|
| 1NF (제1정규형) | 모든 속성 값은 원자값(Atomic Value) 이어야 한다. | 다중값 속성 |
| 2NF (제2정규형) | 1NF를 만족하고, 부분 함수 종속을 제거해야 한다. (완전 함수 종속) | 부분 함수 종속 |
| 3NF (제3정규형) | 2NF를 만족하고, 이행 함수 종속을 제거해야 한다. | 이행 함수 종속 |
| BCNF (보이스-코드 정규형) | 3NF를 만족하고, 모든 결정자가 후보키여야 한다. | 후보키가 아닌 결정자 |
| 4NF (제4정규형) | BCNF를 만족하고, 다치 종속(Multi-valued Dependency) 을 제거해야 한다. | 다치 종속 |
| 5NF (제5정규형) | 4NF를 만족하고, 조인 종속(Join Dependency) 을 이용한다. | 조인 종속 |
제1정규형 (1NF)
제1정규형은 릴레이션의 모든 속성 값이 원자값(Atomic Value) 으로만 구성되어야 한다는 규칙입니다. 즉, 하나의 속성 값에 여러 개의 값이 들어갈 수 없습니다.
- 예시: 학생이 수강하는 과목을 저장할 때,
수강과목속성에 '자료구조, 알고리즘'과 같이 여러 값을 넣으면 1NF를 위반합니다.
[정규화 전]
| 학번 | 이름 | 수강과목 |
|---|---|---|
| 1001 | 김철수 | 자료구조, 알고리즘 |
| 1002 | 이영희 | 운영체제 |
[1NF 정규화 후]
| 학번 | 이름 | 수강과목 |
|---|---|---|
| 1001 | 김철수 | 자료구조 |
| 1001 | 김철수 | 알고리즘 |
| 1002 | 이영희 | 운영체제 |
제2정규형 (2NF)
제2정규형은 릴레이션이 1NF를 만족하고, 부분 함수 종속(Partial Functional Dependency) 을 모두 제거한 상태여야 합니다. 즉, 모든 속성이 기본키 전체에 완전 함수 종속 되어야 합니다. (기본키가 단일 속성이면 항상 2NF를 만족합니다.)
- 예시:
(학번, 과목코드)를 기본키로 사용하는 수강 릴레이션에서,성적은(학번, 과목코드)모두에 종속되지만,교수명은과목코드에만 종속(부분 함수 종속)됩니다.
[정규화 전] (기본키: 학번, 과목코드)
| 학번 | 과목코드 | 교수명 | 성적 |
|---|---|---|---|
| 1001 | CS101 | 김교수 | A+ |
| 1001 | CS202 | 이교수 | A0 |
| 1002 | CS101 | 김교수 | B+ |
[2NF 정규화 후]
[수강 테이블]
| 학번 | 과목코드 | 성적 |
|---|---|---|
| 1001 | CS101 | A+ |
| 1001 | CS202 | A0 |
| 1002 | CS101 | B+ |
[과목 테이블]
| 과목코드 | 교수명 |
|---|---|
| CS101 | 김교수 |
| CS202 | 이교수 |
제3정규형 (3NF)
제3정규형은 릴레이션이 2NF를 만족하고, 이행 함수 종속(Transitive Functional Dependency) 을 모두 제거한 상태여야 합니다. 이행 함수 종속이란, A → B이고 B → C일 때 A → C가 성립하는 관계를 의미합니다.
- 예시:
학번 → 학과코드이고학과코드 → 학과명이라면,학번 → 학과명이라는 이행 함수 종속이 존재합니다.
[정규화 전] (기본키: 학번)
| 학번 | 이름 | 학과코드 | 학과명 |
|---|---|---|---|
| 1001 | 김철수 | CS | 컴퓨터과학 |
| 1002 | 이영희 | EE | 전자공학 |
| 1003 | 박민준 | CS | 컴퓨터과학 |
[3NF 정규화 후]
[학생 테이블]
| 학번 | 이름 | 학과코드 |
|---|---|---|
| 1001 | 김철수 | CS |
| 1002 | 이영희 | EE |
| 1003 | 박민준 | CS |
[학과 테이블]
| 학과코드 | 학과명 |
|---|---|
| CS | 컴퓨터과학 |
| EE | 전자공학 |
BCNF (Boyce-Codd Normal Form)
BCNF는 3NF보다 강력한 정규형으로, 릴레이션의 모든 결정자가 후보키(Candidate Key) 1 여야 한다는 규칙입니다. 3NF의 이상 현상을 대부분 해결하지만, 드물게 발생하는 특정 유형의 이상을 해결하기 위해 BCNF가 필요합니다.
제4정규형 (4NF) & 제5정규형 (5NF)
4NF와 5NF는 실무에서 거의 다루지 않지만, 개념은 알아두는 것이 좋습니다.
- 제4정규형 (4NF): 다치 종속(Multi-valued Dependency, MVD) 을 제거한 정규형입니다. 1:N 관계에서 발생하는 종속성입니다.
- 제5정규형 (5NF): 조인 종속(Join Dependency, JD) 을 이용하는 정규형으로, 모든 조인 종속이 후보키를 통해서만 성립되어야 합니다.
반정규화 (Denormalization)

반정규화는 정규화된 테이블 구조를 의도적으로 통합하거나 중복을 허용하여 데이터베이스의 성능을 향상시키는 과정입니다. 과도한 조인(JOIN)으로 인해 발생하는 성능 저하를 막기 위해 사용되지만, 데이터 일관성이 깨질 위험이 있으므로 신중하게 적용해야 합니다.
- 주요 기법: 테이블 통합, 테이블 분할(수평/수직), 중복 속성 추가 등