데이터 모델링의 이해(데이터 모델의 이해, 엔티티, 속성, 관계, 식별자), 데이터 모델과 SQL(정규화, 관계와 조인의 이해, 모델이 표현하는 트랜잭션의 이해, NULL 속성의 이해, 본질식별자 vs 인조식별자)
데이터 모델의 이해, 엔티티, 속성, 관계, 식별자
*1. 데이터 모델링의 특징
*1-1. 현실 세계를 일정한 형식에 맞추어 표현하는 추상화의 의미를 가질 수 있다.
*1-2. 모델링은 단지 시스템 구현만을 위해 수행되는 테스크가 아니며, 시스템 구현을 포함한 업무분석 및 업무형상화를 하는데 목적이 있다.
*1-3. 복잡한 현싱르 제한된 언어나 표기법으로 이해하기 쉽게 하는 단순화의 의미를 가지고 있다.
*1-4. 모호함을 배제하고 누구나 이해가 가능하도록 정확하게 현상을 기술하는 정확화의 의미를 가진다.
*2-1. 업무 정보를 구성하는 기초가 되는 정보들을 일정한 표기법으로 표현한다.
*2-2. 분석된 모델로 데이터베이스를 생성하여 개발 및 데이터관리에 사용하기 위한 것이다.
*2-3. 데이터 모델링 자체로서 업무의 흐름을 설명하고 분석하는 부분에 의미를 가지고 있다.
*3. 데이터 모델링을 할 때 유의해야 할 사항
*3-1. 중복 : 여러장소의 데이터베이스에 같은 정보를 저장하지 않도록 하여 중복성을 최소화한다.
*3-2. 유연성 : 데이터의 정의를 데이터의 사용 프로세스와 분리하여 유연성을 높인다.
*3-3. 일관성 : 데이터 간의 상호 연관관계를 명확하게 정의하여 일관성 있게 데이터가 유지되도록 한다.
*4. 비유연성
> 데이터 모델을 어떻게 설계했느냐에 따라 사소한 업무변화에도 데이터 모델이 수시로 변경되어 유지보수의 어려움을 가중시킬 수 있다. 데이터의 정의를 데이터의 사용 프로세스와 분리하여 데이터 모델링은 데이터 혹은 프로세스의 작은 변화가 애플리케이션과 데이터베이스에 중대한 변화를 일으킬 수 있는 가능성을 줄인다.
*5. 데이터 독립성의 구성요소
5-1. 통합된 모든 사용자의 관점은 개념스키마와 관련이 있다.
5-2. 물리적인 저장구조를 표현하는 스키마는 내부스키마이다.
5-3. 논리적인 데이터 독립성을 고려하는 단계는 외부단계와 개념적 단계이다.
*6. 개념스키마
- 모든 사용자 관점을 통합한 조직 전체 관점의 통합적 표현
- 모든 응용시스템들이나 사용자들이 필요로 하는 데이터를 통합한 조직 전체의 DB를 기술한 것으로 DB에 저장되는 데이터와 그들 간의 관계를 표현하는 스키마
*7. ERD
*7-1. 1976년 피터 첸에 의해 ERD이라는 표기법이 만들어졌다.
*7-2. 일반적으로 ERD를 작성할 때 엔터티 도출 > 엔터티 배치 > 관계 설정 > 관계명 기술의 흐름으로 작업을 진행한다.
*7-3. 관계의 명칭은 관계 표현에서 매우 중요한 부분에 해당한다.
*8. 엔터티의 특징
*8-1. 속성이 없는 엔터티는 있을 수 없다. 엔터티는 반드시 속성을 가져와야 한다.
*8-2. 엔터티는 다른 엔터티와 관계가 있어야 한다. 단, 통계성 엔터티나, 코드성 엔터티의 경우 관계를 생략할 수 있다.
*8-3. 데이터로서 존재하지만 업무에서 필요로 하지 않으면 해당 업무의 언터티로 성립될 수 없다.
*8-4. 유일한 식별자에 의해 식별이 가능해야한다.
*8-5. 엔티티는 업무 프로세스에 의해 이용되어야 한다.
*8-6. 언터티는 반드시 속성을 포함해야한다.
*9. 발생 시점에 구분할 수 있는 엔터티의 유형
> 행위 엔터티, 중심 엔터티, 기본 엔터티
*10. 엔터티에 이름을 부여하는 방법
10-1. 현업의 업무 용어를 사용하여 업무상의 의미를 분명하게 한다.
10-2. 모든 엔터티에서 유일한 이름이 부여되어야 한다.
10-3. 엔터티가 생성되는 의미대로 자연스럽게 부여하도록 한다.
*11. 업무에서 필요로 하는 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위 : 속성
*12. 속성에 대한 설명
*12-1. 엔터티에 대한 자세하고 구체적인 정보를 나타낸다.
*12-2. 하나의 언터티는 두 개 이상의 속성을 갖는다.
*12-3. 속성도 집합이다.
*12. 데이터를 조회할 때 빠른 성능을 낼 수 있도록 하기 위해 원래 속성값을 계산하여 저장할 수 있도록 만든 속성 : 파생속성
*13. 도메인
> 주문이라는 엔터티가 있을 때 단가라는 속성값의 범위는 100에서 10,000사이의 실수 값이며 제품명이라는 속성은 길이가 20자리 이내의 문자열로 정의할 수 있다.
*14. 데이터 모델링을 할 때 속성의 명칭
*14-1. 속성의 이름에 약어를 사용할 경우 그 의미를 명확하게 이해할 수 없고 혼돈을 초래하여 커뮤니케이션의 혼란을 야기할 수 있으므로 지나친 약어 사용은 가급적 제한하도록 한다.
*14-2. 속성의 이름에는 서술식 용어는 사용하지 않도록 한다.
*14-3. 데이터 모델링 대상에서 사용하는 용어도 있고 외부에서 사용하는 용어도 있어 중복이 있을 때, 가급적 해당 업무에서 자주 사용하는 이름을 이용하도록한다.
*15. 데이터 모델링의 관계
*15-1. 관계는 존재적 관계와 행위에 의한 관계로 나누어볼 수 있다.
*15-2. 부서와 사원 엔터티 간의 '소속' 관계는 존재적 관계의 사례이다.
*15-3. 주문과 배송 엔터티 간의 '배송근거' 관계는 행위에 의한 관계의 사례
*15-4. 관계 표기법은 관계명, 관계차수, 선택성의 3가지 개념으로 표현된다.
*16. 물리적 독립성
- 데이터베이스의 피일 구조의 변화가 논리스키마에 영향을 주지 않음
- 데이터베이스의 색인 구조의 변화가 응용 프로그램에 영향을 주지 않음
*17. 두 개의 엔터티 사이에서 관계를 도출할 때 확인해야 할 사항
*17-1. 두 개의 엔터티 사이에 관심 있는 연관규칙이 존재하는가?
*17-2. 두 개의 엔터티 사이에 정보의 조합이 발생되는가?
*17-3. 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?
*17-4. 업무기술서, 장표에 관계연결을 가능하게 하는 동사가 있는가?
*18. 주식별자를 지정할 때 고려해야할 사항
*18-1. 주식별자에 의해 엔터티 내의 모든 인스턴스들이 유일하게 구분되어야 한다.
*18-2. 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 한다.
*18-3. 지정된 주식별자의 값은 자주 변하지 않는 것이어야 한다.
*18-4. 주식별자가 지정이 되면 반드시 값이 들어와야 한다.
*19. 주식별자의 특징
*19-1. 유일성 : 주식별자에 의해 엔터티 내의 모든 인스턴스들은 유일하게 구분된다.
*19-2. 불변성 : 주식별자가 한번 특정 엔터티에 지정되면 그 식별자의 값은 변하지 않아야한다.
*19-3. 최소성 : 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 한다.
*19-4. 존재성 : 주식별자가 지정되면 반드시 데이터 값이 존재해야 한다.(NULL 허용 암됨)
*20. 데이터 모델링에서 비식별자 관계로 연결
*20-1. 엔터티와 엔터티가 1:M 관계의 부모와 자식관계에서 데이터가 부모 없이 자식쪽 엔터티의 인스턴트가 먼저 생성될 수 있을 경우 비식별자 관계로 연결해야 한다.
*20-2. 부모 엔터티의 인스턴스가 자식 엔터티의 인스턴스보다 먼저 소멸하는 경우 비식별자 관계로 연결해야한다.
*20-3. SQL 문의 조인 관계를 최소화하는 경우 식별자 관계로 연결되어야 한다.
*20-4. 자식 엔터티의 식별자가 부모 엔터티의 주식별자를 상속받아 생성하는 것보다 별도의 주식별자를 생성하는 것이 더 유리하다고 판단되는 경우 비식별자 관계로 연결해야한다.
*21-1. 주식별자
> 대표성을 가지며, 엔터티 내의 여러 인스턴스 중 하나를 유일하게 구분할 수 있는 식별자
*21-2. 보조식별자
> 엔터티 내의 여러 인스턴스 중 하나를 유일하게 구분할 수 있으나, 대표성을 가지지 못하는 식별자
*21-3. 본질식별자
> 엔터티 내의 집합을 명확하게 설명할 수 있는 업무적으로 의미가 부여된 식별자
*21-4. 외부식별자
> 다른 엔터티로부터 상속되어 정의된 식별자
*22-1. 기본 속성 : 업무분석을 통해 바로 정의한 속성
*22-2. 설계 속성 : 원래 업무상 존재하지는 않지만 설계를 하면서 도출해 내는 속성
*22-3. 파생 속성 : 다른 속성으로부터 계산이나 변형이 되어 생성되는 속성
정규화, 관계와 조인의 이해, 모델이 표현하는 트랜잭션의 이해 등
*1. 정규화와 성능
*1-1. 정규화를 수행하면 중복 속성을 제거하여 용량을 최소화시킬 수 있다.
*1-2. 일반적으로 정규화 수행 시 데이터 처리 성능이 향상된다.
*1-3. 반정규화가 조회 성능을 항상 향상시키는 것은 아니며, 때로는 정규화에 의해 성능이 향상될 수도 있다.
*1-4. 정규화로 인행 조회성능이 저하될 수 있다. 이 때문에 반정규화를 고려한다.
*2. 어떤 릴레이션 R이 제 2정규형이고, 기본키에 속하지 않은 속성 모두가 기본키에 이행적 함수종속이 아닐 때 3정규형에 속한다.
*3. 데이터 모델링의 정규화에 대한 설명
*3-1. 정규화는 논리 데이터 모델 상세화 과정의 대표적인 활동으로 논리 데이터 모델의 일관성으 확보하고 중복을 제거하여 속성들이 가장 적절한 엔터티에 배치되도록 함으로써 보다 더 신뢰성 있는 데이터 구조를 얻는데 목적이 있다.
*3-2. 제 1정규형은 모든 인스턴스가 반드시 하나의 값을 가져야 함을 의미한다.
*3-3. 제 3정규형을 만족하는 엔터티의 일반속성은 주식별자 전체에 종속적이다.
*3-4. 반정규화는 성능을 위해 데이터 중복을 허용하는 것이지만 성능의 향상을 항상 보장하는 것은 아니다.
*4. 관계와 조인에 대한 설명
*4-1. 조인이란 식별자를 상속하고, 상속된 속성을 매핑키로 활용하여 데이터를 결합하는 것을 의미한다.
*4-2. 관계를 맺는다는 것은 식별자를 상속시키고 해당 식별자를 매킹키로 활용해 데이터를 결합해 보겠다는 것을 의미한다.
*4-3. Select b.고객명 from 주문 a, 고객 b where a.고객번호=b.고객번호 쿼리에서 조인키는 고객번호이다.
*5-1. NULL 값에 어떤 숫자를 더해도 결과는 항상 NULL이다.
*6. 본질식별자와 인조식별자
*6-1. 인조식별자는 대체로 본질식별자가 복잡한 구성을 가질 때 만들어진다.
*6-2. 인조식별자는 사용하면 중복 데이터를 막기 어려워진다.
*6-3. 인조식별자를 사용하면 본질식별자를 사용할 때와 비교하여 추가적인 인덱스가 필요해진다.
*6-4. 인조식별자는 단점도 존재하므로 꼭 필요한 경우에만 사용하는 것이 바람직하다.
'IT' 카테고리의 다른 글
SQL 자격검증 실전문제 SQL 기본 및 활용(관계형 데이터베아스 개요, SELECT문, 함수, WHERE 절, GROUP BY, HAVING 절, ORDER BY 절, 조인, 표준 조인) (2) | 2024.11.09 |
---|---|
SQL 자격 검정 실전문제 SQL 수행구조(데이터베이스 아키텍쳐, SQL 처리과정, 데이터베이스 I/O), SQL 분석도구(예상 실행계획, SQL 트레이스, 응답 시간 분석) (0) | 2024.11.09 |
데이터 사일로 해결책은 데브옵스(DevOps)? 데브옵스에 대한 정의 (3) | 2024.08.27 |
[IT테크 지식] OLTP와 OLAP 비교 해보자! (1) | 2024.08.23 |
PG 결제 서비스에 대한 이해, 결제 서비스에 대해 알아보자(웹훅, API 폴링이란) (2) | 2023.12.20 |