데이터베이스 정규화와 반정규화

DB물리DB 설계정규화
읽는데 6분 소요
처음 쓰여진 날: 2025-09-21
마지막 수정일: 2025-09-22

요약

정보처리기사 시험의 핵심 개념인 데이터베이스 정규화(Normalization)의 모든 것을 알아봅니다. 1NF부터 5NF까지 각 정규형의 개념과 조건, 그리고 반정규화의 개념까지 예제와 함께 쉽게 설명하고 실기 대비 문제로 마무리합니다.

데이터베이스 정규화란?

정규화(Normalization) 는 관계형 데이터베이스에서 데이터의 중복을 최소화하고, 데이터 무결성을 보장하기 위해 테이블 구조를 체계적으로 분해하는 과정입니다. 정규화를 통해 이상 현상(Anomaly)을 방지하고, 데이터 구조의 안정성과 유지보수성을 향상시킬 수 있습니다.

정규화는 정리 정돈과 비슷합니다.
정규화는 정리 정돈과 비슷합니다.

정규화 단계 요약

정규형핵심 조건제거 대상
1NF (제1정규형)모든 속성 값은 원자값(Atomic Value) 이어야 한다.다중값 속성
2NF (제2정규형)1NF를 만족하고, 부분 함수 종속을 제거해야 한다. (완전 함수 종속)부분 함수 종속
3NF (제3정규형)2NF를 만족하고, 이행 함수 종속을 제거해야 한다.이행 함수 종속
BCNF (보이스-코드 정규형)3NF를 만족하고, 모든 결정자가 후보키여야 한다.후보키가 아닌 결정자
4NF (제4정규형)BCNF를 만족하고, 다치 종속(Multi-valued Dependency) 을 제거해야 한다.다치 종속
5NF (제5정규형)4NF를 만족하고, 조인 종속(Join Dependency) 을 이용한다.조인 종속

제1정규형 (1NF)

제1정규형은 릴레이션의 모든 속성 값이 원자값(Atomic Value) 으로만 구성되어야 한다는 규칙입니다. 즉, 하나의 속성 값에 여러 개의 값이 들어갈 수 없습니다.

  • 예시: 학생이 수강하는 과목을 저장할 때, 수강과목 속성에 '자료구조, 알고리즘'과 같이 여러 값을 넣으면 1NF를 위반합니다.

[정규화 전]

학번이름수강과목
1001김철수자료구조, 알고리즘
1002이영희운영체제

[1NF 정규화 후]

학번이름수강과목
1001김철수자료구조
1001김철수알고리즘
1002이영희운영체제

제2정규형 (2NF)

제2정규형은 릴레이션이 1NF를 만족하고, 부분 함수 종속(Partial Functional Dependency) 을 모두 제거한 상태여야 합니다. 즉, 모든 속성이 기본키 전체에 완전 함수 종속 되어야 합니다. (기본키가 단일 속성이면 항상 2NF를 만족합니다.)

[정규화 전] (기본키: 학번, 과목코드)

학번과목코드교수명성적
1001CS101김교수A+
1001CS202이교수A0
1002CS101김교수B+

[2NF 정규화 후]

[수강 테이블]

학번과목코드성적
1001CS101A+
1001CS202A0
1002CS101B+

[과목 테이블]

과목코드교수명
CS101김교수
CS202이교수

제3정규형 (3NF)

제3정규형은 릴레이션이 2NF를 만족하고, 이행 함수 종속(Transitive Functional Dependency) 을 모두 제거한 상태여야 합니다. 이행 함수 종속이란, A → B이고 B → C일 때 A → C가 성립하는 관계를 의미합니다.

[정규화 전] (기본키: 학번)

학번이름학과코드학과명
1001김철수CS컴퓨터과학
1002이영희EE전자공학
1003박민준CS컴퓨터과학

[3NF 정규화 후]

[학생 테이블]

학번이름학과코드
1001김철수CS
1002이영희EE
1003박민준CS

[학과 테이블]

학과코드학과명
CS컴퓨터과학
EE전자공학

BCNF (Boyce-Codd Normal Form)

BCNF는 3NF보다 강력한 정규형으로, 릴레이션의 모든 결정자가 후보키(Candidate Key) 1 여야 한다는 규칙입니다. 3NF의 이상 현상을 대부분 해결하지만, 드물게 발생하는 특정 유형의 이상을 해결하기 위해 BCNF가 필요합니다.


제4정규형 (4NF) & 제5정규형 (5NF)

4NF와 5NF는 실무에서 거의 다루지 않지만, 개념은 알아두는 것이 좋습니다.


반정규화 (Denormalization)

정리를 너무하면 피곤해요. 반정규화는 정리를 조금 푼다고 생각하세요.
정리를 너무하면 피곤해요. 반정규화는 정리를 조금 푼다고 생각하세요.

반정규화는 정규화된 테이블 구조를 의도적으로 통합하거나 중복을 허용하여 데이터베이스의 성능을 향상시키는 과정입니다. 과도한 조인(JOIN)으로 인해 발생하는 성능 저하를 막기 위해 사용되지만, 데이터 일관성이 깨질 위험이 있으므로 신중하게 적용해야 합니다.


정보처리기사 실기 대비 문제


Footnotes

  1. 후보키(Candidate Key 는 릴레이션(테이블)에서 각 튜플(행)을 유일하게 식별할 수 있는 최소한의 속성(열)들의 집합입니다. 하나의 릴레이션에는 여러 개의 후보키가 존재할 수 있으며, 이 중 하나를 선택하여 기본키(Primary Key) 로 사용합니다. 나머지 후보키는 대체키(Alternate Key) 라고 부릅니다.참고