외워야할 것 모음
*개체관계 다이어그램를 사용하며 사용자의 요구에 대한 트랜잭션을 모델링하는 단계는 ?
*정규화를 진행하며 트랙잭션의 인터페이스를 설계하는 단계, 사람이 이해하기 쉽게 표현한 모델링하는 단계는 ?
*반정규화를 진행하며 각 DBMS의 특성을 고려하여 데이터베이스 저장 구조(물리 데이터 모델)로 변환하는 모델링 하는 단계는 ?
정답
개념적 설계/ 논리적 설계 / 물리적 설계
릴레이션/튜플/속성/카디널리티/차수/스키마/인스턴스 ?
정답
릴레이션 : 행과 열로 구성된 테이블
튜플 : 릴레이션의 행에 해당하는 요소
속성 : 릴레이션의 열에 해당하는 요소
카디널리티 : 튜플의 수
차수 : 애트리뷰트의 수
스키마 : 데이터베이스의 구조, 제약 조건 등의 정보를 담고 있는 기본적인 구조
인스턴스 : 정의된 스키마에 따라 생성된 테이블에 실제 저장된 데이터의 집합
σ,π,⋈,÷ (연산자의 영어/한글이름)
정답
σ : select : 조건을 만족하는 튜플을 반환
π : project : 주어진 속성들의 값으로만 구성된 튜플 반환
⋈ : 공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플을 반환
÷ : 어떤 릴레이션의 모든 튜플과 관련있는 튜플을 반환
이상현상에 대하여
정보 저장 시 불필요한 세부정보를 입력해야하는 경우
정보 삭제 시 원치 않는 다른 정보가 같이 삭제되는 경우
중복 데이터 중에서 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우
정답
삽입/삭제/갱신 이상
정규화
정답
1정규형(1NF): 원자값으로 구성
2정규형(2NF): 부분 함수 종속 제거
3정규형(3NF): 이행함수 종속 제거(A→B, B→C ⇒ A→C 분리)
보이스-코드 정규형(BCNF): 결정자 후보 키가 아닌 함수 종속 제거
4정규형(4NF): 다치(다중 값) 종속 제거
5정규형(5NF): 조인 종속 제거
파일시스템
ISAM:
VSAM:
정답
ISAM :
- Indexed Sequential Access Method
- 자료 내용은 주 저장부, 자료 색인은 자료가 기록된 위치와 함께 색인부에 기록되는 시스템
VSAM :
- Virtual Stroage Access Method
- 대형 운영체제에서 사용되는 파일 관리시스템
3. 데이터 입출력 구현
01. 논리 데이터 저장소 확인
1. 데이터 모델(Data Model)
a. 데이터 모델 개념
- 추상화하여 표현한 모델
- 표시 요소
- 연산: 데이터 베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세
- 구조: 개체 타입과 개체 타입간의 관계, 데이터 구조 및 정적 성질을 표현하는 요소
- 제약조건: 데이터 무결성 유지를 위한 DB의 보편적 방법
b. 데이터 모델 절차
-
요구사항 분석 → 개념적 데이터 모델 → 논리적 데이터 모델 → 물리적 데이터 모델
- 요구조건 분석
- 개념적 설계: 사용자의 요구에 대한 트랜잭션을 모델링 하는 단계(*개체관계 다이어그램)
- 논리적 설계: 트랙잭션의 인터페이스를 설계하는 단계, 사람이 이해하기 쉽게 표현한 모델 (*정규화 진행)
- 물리적 설계: 각 DBMS의 특성을 고려하여 데이터베이스 저장 구조(물리 데이터 모델)로 변환하는 모델 (*반정규화 수행)
2. 논리 데이터 모델 검증
- 논리 데이터 모델링 개념
- 논리적 데이터 모델링 종류
- 관계 데이터 모델: 2차원 테이블 형태, 기본 키와 외래 키 관계 표현
- 계층 데이터 모델: 트리 형태, 상하관계 존재, 1:N만 허용
- 네트워크 데이터 모델: 그래프 형태, N:M 관계
-
관계 데이터 모델
a. 관계 데이터 모델
-
행과 열로 구성된 2차원 테이블 형태 (수학자 E.F.Codd박사 제안)
-
구성요소
- 릴레이션
- 튜플
- 속성
- 카디널리티
- 차수
- 스키마
- 인스턴스
b. 관계 데이터 모델의 표현
c. 관계대수
- 관계형DB에서 원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 정형 언어
-
일반 집합 연산자
- 합집합(Union, R ∪ S)
- 교집합(Intersection, R ∩ S)
- 차집합(Difference, R ─ S)
- 카디션 프로덕트(CARTENSIAN Product, R X S) : R과 S에 속한 모든 튜플을 연결해 만들어진 새로운 튜플로 릴레이션 구성 -
- 순수 과계 연산자
- - 셀렉트(Select, σ조건(R): 릴레이션R에서 조건을 만족하는 튜플 반환
- - 프로젝트(Project, π속성리스트(R))
- 릴레이션R에서 주어진 속성들의 값으로만 구성된 튜플 반환
- 조인(Join, R ⋈ S): 공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플 반환
- 디비전(Division, R ÷ S): 릴레이션S의 모든 튜플과 관련있는 R의 튜플 반환
d. 관계해석
- 튜플 관계 해석과 도메인 관계 해석을 하는 비절차적 언어
- 프레디킷 해석(Predicate Calculus)에 기반한 언어
- 비절차적 언어(원하는 정보가 무엇이라는 것만 선언)
-
4. 논리 데이터 모델링 속성
- 개체
- 속성
- 관계
5. 개체-관계(E-R) 모델
-
표기법 - 개체(사각형)
- 관계(마름모)
- 속성(타원)
- 다중 값 속성(이중타원)
- 관계-속성 연결(선)
- 기본키(타원 내부 밑줄 선)
6. 정규화
- 관계 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성과 정확성을 유지하기 위해 무손실 분해하는 과정
-
이상현상: 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상
- 삽입 이상: 정보 저장 시 불필요한 세부정보를 입력해야하는 경우
- 삭제 이상: 정보 삭제 시 원치 않는 다른 정보가 같이 삭제되는 경우
- 갱신 이상: 중복 데이터 중에서 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우 -
정규화 단계
- 1정규형(1NF): 원자값으로 구성
- 2정규형(2NF): 부분 함수 종속 제거
- 3정규형(3NF): 이행함수 종속 제거(A→B, B→C ⇒ A→C 분리)
- 보이스-코드 정규형(BCNF): 결정자 후보 키가 아닌 함수 종속 제거
- 4정규형(4NF): 다치(다중 값) 종속 제거
- 5정규형(5NF): 조인 종속 제거
7. 반 정규화(비정규화, 역정규화)
- 정규화된 엔터티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법
- 반 정규화를 위해서는 데이터의 일관성과 무결성을 우선으로 할지, 데이터베이스의 성능과 단순화를 우선순위에 둘 것인지 조정하는 과정이 중요
- 반 정규화 기법
- 테이블
- 테이블 병합
- 테이블 분할(파티셔닝)
- 수평 분할: 레코드를 기준으로 활용
- 수직 분할
- 중복 테이블 추가
- 집계 테이블 추가
- 진행 테이블 추가
- 특정 부분만을 포함하는 테이블 추가
- 컬럼
- 컬럼 중복화: 조인 성능 향상을 위한 중복 허용
- 관계
- 중복관계 추가: 조인시 발생할 수 있는 성능 저하를 예방하기 위해 추가적 관계를 맺는 방법
- 테이블
02. 물리 데이터 저장소 설계
1. 물리 데이터 모델 설계
2. 물리 데이터 저장소 구성
03. 데이터 베이스 기초 활용하기
1. 데이터베이스 종류
- 정의: 통합된 데이터, 저장된 데이터, 운영 데이터, 공용 데이터
- 특성: 실시간 접근성, 계속적인 변화, 동시 공용, 내용 참조
- 데이터베이스 종류
- 파일 시스템(File System):
- 관계형 데이터베이스 관리시스템(RDBMS): 관계형 모델을 기반으로 하는 가장 보편화된 데이터베이스 관리시스템
- 계층형 데이터베이스 관리시스템(HDBMS): 데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스
- 네트워크 데이터 베이스 관리시스템(NDBMS)
- 데이터베이스 관리 툴
2. DBMS
- DBMS는 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 검색, 삭제 등의 기능을 지원하는 소프트웨어
- DBMS 유형
- 키-값(key-value) DBMS
- 컬럼 기반 데이터 저장(Column Family Data Store) DBMS
- 문서 저장(Document Store) DBMS
- 그래프(Graph) DBMS
- 특징
- 무결성
- 일관성
- 회복성
- 보안성
- 효율성
3. 데이터베이스 기술 트랜드
- 빅데이터
- NoSQL
- 데이터 마이닝
기출문제 & 예상문제
3-52 페이지 13번
13) 다음 내용이 설명하는 NoSQL의 유형에 대해서 쓰시오
- Key 안에 (Column, Value) 조합으로 된 여러개의 필드를 갖는 DB
- 테이블 기반, 조인 미 지원, 컬럼 기반, 구글의 Bigtable 기반으로 구현
- 대표적으로 HBase, Cassandra 등이 있음
정답
Column Family Data Store
3-53 페이지 18번
18) 다음이 설명하는 관계 대수의 일반 집합 연산자는 무엇인가?
- R X S 로 표현되며 R과S에 속한 모든 튜플을 연결해 만들어진 새로운 튜플로 릴레이션 구성
- 기호는 ‘X’ 로 표기
정답
카티션 프로덕트
20년 1회
5) 데이터 마이닝이란 무엇인지 설명하시오.
정답
많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정
15) 데이터베이스 성능 개선과 관련하여 ‘데이터베이스 반정규화’란 무엇인지 설명하시오.
정답
시스템의 성능 향상, 개발 및 운영의 편의성 등을 위해 정규화된 데이터 모델을 통합, 중복, 분리하는 과정으로, 의도적으로 정규화 원칙을 위배하는 행위
20년 2회

정답
개념적 설계 - 논리적 설계 - 물리적 설계
20년 3회
10) 릴레이션 A, B가 있을 때 릴레이션 B 조건에 맞는 것들만 릴레이션 A에서 튜플을 꺼내 프로젝션하는 관계대수의 기호는 무엇인가?
정답
÷
21년 1회

정답
A: 물리적 설계
B: 개념적 설계
C: 논리적 설계
8) 정규화된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법을 무엇이라고 하는지 쓰시오
정답
반정규화

정답
Cardinality : 5
Degree : 4

정답
A:.연산
B: 구조
C: 제약조건
21년 2회

정답
제2정규형