데이터 모델과 성능 - 정규화와 성능, 반정규화와 성능

SQLD자격증공부/개념

김옹희 2023. 5. 2. 22:14

1. 정규화와 성능

성능 데이터 모델링의 개념

성능 데이터 모델링의 수행 절차

정규화의 개념

이상현상 ( Abnomality )

정규화의 단계

제1정규화	테이블 내 속성의 원자성을 확보하는 단계 기본키를 설정
제2정규화	기본키가 2개 이상의 속성으로 이루어진 경우 부분 함수 종속성을 제거
제3정규화	기본키를 제외한 컬럼 간 종속성을 제거 이행 함수 종속성 제거
BCNF (Boyce-Code Normal Form)	기본키를 제외하고 후보키가 있는 경우, 후보키가 기본키를 종속시키면 분해 결정자 함수 종속성을 제거하는 단계 강한 제3정규화
제4정규화	여러 컬럼들이 하나의 컬럼을 종속시키는 경우 분해하여 다중값 종속성을 제거
제5정규화	조언에 의한 종속성이 발생되는 경우 분해

정규화 주의사항

모든 정규화는 이전 정규화를 만족해야 한다.
정규화시 이상현상은 제거 되지만 테이블의 분해로 데이터 조인의 발생이 많이지고, 이는 조회 성능 저하로 이어질 수 있다. (I/O증가 및 조인 연산 증가)
단일 테이블 조회시에는 데이터 중복이 제거되어 조회 성능이 향상 될 여지가 있다.

2. 반정규화와 성능

반정규와의 개념

반정규화를 수행해야 하는 경우

반정규화의 절차

대상 조사 및 검토
- 데이터 처리 범위, 통계성 등을 확인 후 반정규화를 수행한다.
- 대량의 범위처리 및 빈도수, 통계성 프로세스, 테이블 조인 수
다른 방법 검토
- 클러스터링, 뷰, 인덱스, 응용 프로그램, 파티셔닝 등 다른 방법으로 해결 할 수 있는지 확인한다.
반정규화 수행
- 테이블, 속성, 관계 등을 반정규화 한다.
- 테이블 반정규화, 속성의 반정규화, 관계의 반정규화

반정규화 기법

컬럼의 반정규화

중복컬럼추가

파생컬럼추가

이력테이블 컬럼추가

PK에 의한 컬럼추가

응용프로그램 오작동을 위한 컬럼추가

관계의 반정규화

중복관계 추가

데이터베이스 구조

분산 데이터베이스의 투명성

분할 투명성	고객은 하나의 논리적 관계가 여러 단편으로 분할 되어 각 단편이 사본이 여러 시스템에 저장 되어 있음을 알 필요 없다.
위치 투명성	고객이 사용하는 데이터베이스의 위치를 알릴 필요가 없다. 어느 위치에서 접근 하더라도 동일한 명령으로 접근 할 수 있어야 한다.
지역 사상 투명성	지역 DBMS와 물적 데이터베이스 사이의 사상이 보장됨에 따라 각 지역 시스템 이름과 무관한 이름을 사용할 수 있다.
중복 투명성	데이터베이스 객체가 여러 시스템에 중복되어 존재함에도 고객과는 무관하게 데이터 일관성이 유지 되어야 한다.
장애 투명성	데이터베이스가 분산되어 있는 각 지역의 시스템이나 통신망에 이상이 발생해도 데이터의 무결성은 보장 되어야 한다.
병행 투명성	여러 고객의 응용프로그램이 동시에 분산 데이터베이스에 대한 트랜잭션을 수행하는 경우에도 결과에 이상이 없어야 한다.

분산 데이터베이스 설계 방식

분산 데이터베이스 장점과 단점

장점	단점
1. 데이터베이스 신뢰성과 가용성이 높다. 2. 분산 데이터베이스가 병렬 처리를 수행하기 때문에 빠르다. 3. 분산 데이터베이스를 추가하여 시스템 용량 확장이 쉽다.	1. 데이터베이스가 여러 네트워크를 통해서 분리되어 있기 때문에 관리 및 통제가 어렵다. 2. 보안관리가 어렵다. 3. 데이터 무결성 관리가 어렵다. 4. 데이터베이스 설계가 복잡하다.