본문 바로가기

SQLD

[SQLD : Ⅱ. 데이터 모델과 성능] 6-1. 분산데이터베이스와 성능 - 개요

* 분산데이터베이스의 개요

 - 데이터베이스를 분산하여 저장하고 이를 하나의 데이터베이스로 인식하여 사용하는 기술

 - 클라우드 컴퓨팅, SOA를 인식하듯 분산 데이터베이스를 인식하고 연구 도입하려는 기업이 많아짐

 - 분산데이터베이스의 정의 :

   여러 곳으로 분산된 데이터베이스를 하나의 가상 시스템으로 사용하도록 한 데이터베이스

   논리적으로 동일한 시스템에 속하지만 컴퓨터 네트워크를 통해 물리적으로 분산된 데이터들의 모임

   물리적 SITE분산, 논리적 사용자 통합, 공유

 - 분산데이터베이스는 데이터베이스를 연결하는 빠른 네트워크 환경을 이용하여 

   여러 지역 여러 노드로 위치시켜 사용성/성능 등을 극대화 시킨 데이터베이스

 

* 투명성

 1) 분할 투명성 (단편화) : 하나의 논리적 Relation이 여러 단편으로 분할되어 각 단편의 사본이 여러 site에 저장
 2) 위치 투명성 : 사용하려는 데이터의 저장 장소 명시 불필요. 위치정보가 System Catalog에 유지되어야 함
 3) 지역사상 투명성 : 지역DBMS와 물리적 DB사이의 Mapping 보장. 각 지역시스템 이름과 무관한 이름 사용 가능
 4) 중복 투명성 : DB 객체가 여러 site에 중복 되어 있는지 알 필요가 없는 성질
 5) 장애 투명성 : 구성요소(DBMS, Computer)의 장애에 무관한 Transaction의 원자성 유지
 6) 병행 투명성 : 다수 Transaction 동시 수행시 결과의 일관성 유지, Time Stamp, 분산 2단계 Locking을 이용 구현

 

* 분산데이터베이스의 적용방법

 - 업무의 흐름을 보고 업무구성에 따른 아키텍처 특징에 따라 데이터베이스를 구성

 - 업무의 특징에 따라 데이터베이스 분산구조를 선택적으로 설계하는 능력이 필요

 

* 분산데이터베이스 장단점

 

* 분산데이터베이스의 활용 방향성 

 - 업무적인 기능이 다양해지고 데이터 양이 기하급수적으로 증가하는 최근 데이터베이스 환경에 적용

 - 업무적인 특징에 따라 분산 데이터베이스 활용 기술이 필요

* 데이터베이스 분산구성의 가치

 - 데이터를 분산 환경으로 구성하면 빠른 성능을 제공함

 - 원거리 또는 다른 서버에 접속, 처리로 발생하는 네트워크 부하, 트랜잭션 집중에 따른 성능 저하 방지