Chapter 3. 빅데이터의 분산 처리

1. 대규모 분산 처리의 프레임워크

구조화 데이터와 비구조화 데이터

Hadoop

Spark

2. 쿼리 엔진

데이터 마트 구축의 파이프라인

'Hive에 의한 구조화 데이터 작성

대화형 쿼리 엔진 Presto의 구조

데이터 분석의 프레임워크 선택하기

3. 데이터 마트의 구축

팩트 테이블 ― 시계열 데이터 축적하기

집계 테이블 ― 레코드 수 줄이기

스냅샷 테이블 ― 마스터의 상태를 기록하기

이력 테이블

4. 요약

Last updated