[Database] 모델링과 개체-관계 모델 및 다이어그램


데이터베이스 구축의 의미

  1. 의미

    • 현실 세계의 대상물을 컴퓨터 세계의 데이터로 변환하기 위한 일련의 과정
    • 현실 세계의 대상물에서 데이터베이스에 저장할 가치가 있는 데이터만 찾아야 함
    • 컴퓨터에서 다루기 쉬운 구조로 변환하여 저장


모델, 모델링 (Modeling) 및 추상화

  1. 모델

    • 복잡한 상황을 이해하기 쉽게 표현하기 위하여 개념적으로 단순화하여 표현한 것
    • 데이터베이스에 저장할 가치가 있는 데이터를 내포
  2. 모델링

    • 현실 세계에 존재하는 데이터를 컴퓨터 세계의 데이터로 옮기는 변환 과정
    • 데이터베이스 설계의 핵심 과정
  3. 추상화

    -현실세계에서 발생되는 상황을 모델링하는 것을 추상화라 함 -현실의 반복적인 작업(계산)을 프로그램 개발하는 것도 추상화 과


데이터 모델

  • 데이터의 관계, 접근, 처리과정에 관한 추상화된 모형
  • 데이터 모델은 데이터 구조를 결정
  1. 개념적 데이터 모델 (CDM, Conceptual Data Model)

    • 대상물의 의미를 표현
    • 데이터베이스에서 사용될 개념과 관계를 표현
    • 가장 많이 사용되는 모델 : 개체-관계모델 (E-R Model, Entity-Relationship Model)
  2. 논리적 데이터 모델 (LDM, Logical Data Model)

    • 세부적으로 표현된 대상물의 데이터 표현
    • 사람, 장소, 사물, 규칙, 관계 등의 대상물과 이들 사이의 이벤트를 표준화한다.
    • 사용하는 이유

      • 데이터 요소과 요구에 대한 일반적인 이해에 도움이 된다.
      • 데이터베이스 설계의 기초를 제공한다.
      • 데이터를 재사용하거나 공유할 수 있다.
      • 개발 및 유지보수 시간과 비용을 줄일 수 있다.

    • 가장 많이 사용되는 모델 : 관계 데이터 모델(Relational Data Model)
  3. 물리적 데이터 모델 (PDM, Physical Data Model)

    • 데이터베이스 관리 시스템의 기능과 제약을 고려한 데이터 설계를 표현
    • 테이블간의 관계, 성능 향상을 위한 인덱스, 제약사항 정의, 링크 테이블, 파티션 테이블 등의 데이터베이스 구조를 포함하여야 한다.


데이터 모델링

  1. 데이터 모델링 과정

    • 요구사항 수집 및 분석
    • 중요 개념을 추출 (개념적 모델링)
    • 각 개념을 구체화 (논리적 모델링)
    • 데이터베이스 생성 (물리적 모델링)


  1. 요구사항 수집 및 분석

    • 데이터베이스로 구현할 대상과 사용자의 요구 사항에 대한 정보를 수집하고 분석
    • 구축할 데이터베이스에 대한 전문적인 지식이 필요함
    • 각 개념을 구체화 (논리적 모델링)
    • 요구사항 수집 방법

      • 실제 문서를 수집하고 분석
      • 데이터베이스를 사용할 담당자의 의도를 정확하게 파악하고 요구사항을 수렴
      • 비슷한 업무를 처리하는 기존의 데이터베이스를 분석
      • 연관성 있는 업무를 참고하여 요구사항을 분석
  2. 개념적 모델링 (Conceptual Modeling)

    • 데이터베이스로 구현할 대상에 대한 데이터를 추출하고 각 데이터들 간의 관계를 정의
    • 건물의 기본 골조를 만드는 과정과 같이 데이터베이스의 골격을 만드는 과정
    • 사용자의 요구사항을 분석하여 가장 핵심적인 개체와 개별 개체를 식별할 수 있는 핵심 속성, 각 개체간의 관계를 정의하여 일반적인 개념으로 표현
    • 개체-관계 다이어그램 (ERD, Entity Relationship Diagram) : 간단하게 작성
    • 예 : 회사의 프로젝트 관리

      • 연구원 – 사번, 이름, 직위
      • 프로젝트 – 과제명, 예산, 기간


  1. 논리적 모델링 (Logical Modeling)

    • 개념을 구체화하여 데이터베이스로 구현하기 위한 모델을 만드는 과정
    • 예 : 동물에 대한 모델

      • 추상화 과정을 통하여 동물에 대한 정보를 모델링하여 데이터베이스에 저장한다.
    • 논리적 데이터 모델링 과정

      • 개념적 데이터모델링에서 추출하지 않은 모든 상세정보를 추출한다.
      • 데이터의 표준화를 수행한다. (용어 정리, 데이터의 형태 및 크기 등을 확정)


  1. 물리적 모델링 (Physical Modeling)

    • 작성된 논리적 모델을 실제 컴퓨터의 저장 장치에 저장하기 위한 물리적 구조를 정의하고 구현하는 과정
    • 고려 사항

      • 응답시간을 최소화해야 한다(응답시간 : 트랜잭션이 시작되어 종료될 때까지 걸리는 시간)
      • 데이터가 저장될 공간을 효율적으로 배치해야 한다.


개체-관계 모델

  1. 개체-관계 모델 (ERM, ER Model, Entity Relationship Model)

    • 모델링하고자하는 대상물 또는 처리과정에서의 요구사항에 대하여 데이터나 정보를 묘사하기 위한 데이터 모델
    • 개체와 개체간의 관계
    • 관계형 데이터베이스에서 궁극적으로 구현되어지는 추상적인 방법
    • 1976년, 피터 첸 (Peter Chen)이 제안
    • 구성 요소 : 개체(Entity), 속성(Attribute), 관계(Relationship)

  2. 개체/엔티티 (Entity)

    • 정보의 세계에서 의미있는 하나의 정보 단위
    • 저장할 가치가 있는 중요 데이터를 가지고 있는 대상물(사람, 사물, 개념 등)
    • 특징

      • 유일한 식별자(이름)으로 구별될 수 있어야 한다.
      • 속성(고유한 특성, 상태)을 가지고 있어야 함
      • 다른 개체와 한 개 이상의 관계를 가지고 있음

    • 파일시스템이나 데이터베이스에서 하나의 레코드로 표현됨

  3. 속성/애트리뷰트 (Attribute)

    • 사물의 본질적인 고유의 성질(특성)으로, 의미 있는 데이터의 가장 작은 단위
    • 파일시스템이나 데이터베이스에서 하나의 필드로 표현됨
    • 예: 사람의 속성 - 이름, 출생일, 성별, 국적 등

  4. 관계 (Relationship)

    • 개체들 사이의 연관성을 정의
    • “두 개체가 관계가 있다” - 상호 공유하는 속성이 있다
      • 구매 (관계) - 고객/물품
      • 수강 (관계) - 학생/수강과목

  5. 개체-관계 다이어그램 (ERD, Entity Relationship Diagram)

    • ER 모델을 표준화된 그림으로 표현한 것
    • E-R 다이어그래밍 도구 : ER 모델과 SQL을 해석하고 만들 수 있다.
    • 다이어그램 종류

      • 피터첸 표기법 : ER 모델의 기본적인 표기법
      • IE 표기법 (Information Engineering Notation) / 새발 표기법 (Crow-feet Notation)
      • 바커 표기법 (Baker Notation)