데이터 웨어하우스
기업이나 조직이 각종 데이터들을 한 곳에 모아서 통합하고, 효율적으로 분석하고 조회할 수 있는 중앙 데이터 저장소
일반적으로 기업은 다양한 소스에서 많은 양의 데이터를 생성하고 수집한다. 이러한 데이터는 데이터베이스, 엑셀 파일, 웹 로그 등 다양한 형태로 존재하며, 각각의 데이터 소스에 따라 데이터가 분산되어 있다. 데이터 웨어하우스는 이렇게 분산된 데이터를 한 곳에 통합하여 정리하고, 효율적으로 분석하고 비즈니스 인텔리전스(BI) 도구를 활용하여 의사 결정에 도움을 준다.
데이터 웨어하우스의 주요 특징:
중앙 집중화: 다양한 데이터 소스에서 추출한 데이터를 중앙 데이터베이스에 통합하여 한 곳에서 관리한다.
통합된 데이터: 데이터 웨어하우스는 일관된 형식으로 데이터를 저장하고, 데이터 품질을 유지하며, 중복을 최소화하여 데이터의 일관성과 정확성을 보장한다.
역사 데이터 저장: 데이터 웨어하우스는 시간에 따른 데이터의 변화를 추적하기 위해 과거 데이터를 저장하고 관리한다.
의사 결정 지원: 데이터 웨어하우스는 OLAP (Online Analytical Processing) 도구와 같은 비즈니스 인텔리전스(BI) 도구를 활용하여 데이터를 쿼리하고 분석하여 의사 결정에 도움을 준다.
데이터 웨어하우스는 비즈니스 리포팅, 데이터 마이닝, 통계 분석 등 다양한 분석 작업에 활용되며, 기업이나 조직이 보다 효율적인 의사 결정을 내리고 비즈니스 성과를 향상시키기 위해 중요한 역할을 한다.
데이터 마트
데이터 웨어하우스의 일종으로, 기업이나 조직의 특정 부서나 업무 영역에 초점을 맞추어 구축된 작은 규모의 데이터 저장소
데이터 마트는 데이터 웨어하우스와 유사한 목적을 가지지만, 더 특정한 분석 목적을 위해 구성되며, 특정 부서나 사용자들이 필요로 하는 데이터를 더 빠르고 효율적으로 제공하기 위해 사용된다.
데이터 마트의 주요 특징:
특정 주제나 부서에 초점: 데이터 마트는 전체 조직의 모든 데이터를 포함하지 않고, 특정 부서나 업무 영역에 필요한 데이터를 집중적으로 포함한다. 예를 들어, 영업 부서의 데이터 마트는 주로 영업 활동과 관련된 데이터를 포함할 수 있다.
상대적으로 작은 규모: 데이터 마트는 전체 데이터 웨어하우스보다 작은 규모로 구성되는 경우가 많다. 이는 해당 부서의 특정 요구사항을 충족하기 위해 필요한 데이터만 선택적으로 저장하여 더 빠른 데이터 액세스를 제공하기 위함이다.
빠른 응답 시간: 데이터 마트는 작은 규모로 구축되고 특정 요구사항을 위해 최적화되어 있으므로, 해당 부서나 사용자들이 빠르게 데이터를 조회하고 분석할 수 있다.
독립적 운영: 데이터 마트는 데이터 웨어하우스와 별개로 구성될 수 있으며, 독립적으로 운영되기도 한다. 이는 데이터 마트가 특정 부서나 업무 영역의 요구사항을 만족시키기 위해 필요한 데이터를 중점적으로 다루기 때문이다.
데이터 마트는 데이터 웨어하우스의 일부로 구성되기도 하고, 독립적으로 운영되기도 한다. 데이터 웨어하우스의 전체 데이터를 더 작은 단위로 쪼개어 관리하거나, 특정 부서나 업무 영역에 따라 독립적으로 구축하는 방식으로 데이터 마트를 구성할 수 있다. 데이터 마트는 특정 부서나 사용자들이 빠르고 효율적으로 필요한 데이터를 얻기 위한 유용한 도구로 활용된다.
'Data Engineering > 빅데이터를 지탱하는 기술' 카테고리의 다른 글
[빅데이터를 지탱하는 기술] 빅데이터 탐색 (0) | 2023.11.13 |
---|---|
[빅데이터를 지탱하는 기술] 빅데이터 기초 지식 (3) | 2023.11.10 |
[빅데이터를 지탱하는 기술] NoSQL 데이터베이스 (1) | 2023.08.01 |
[빅데이터를 지탱하는 기술] Hadoop VS Spark (0) | 2023.07.28 |
[빅데이터를 지탱하는 기술] Spark (0) | 2023.07.28 |