Search
🎰

비즈니스에 맞는 데이터파이프라인 쉽고 빠르게 구축하기 (이치호, AWS)

Agenda

기대 효과

데이터를 통해 얻을 수 있는 것

필요한 데이터

필요한 데이터
트랜잭션 데이터
기업에서 발생되는 모든 거래, 고객, 상품 데이터 등을 의미
고객 행동 로그
웹서버나 모바일 앱 등에서 수행되는 모든 고객 행동 로그
기타 데이터
GA, 엑셀 데이터등등…
S3
비용 - $25/1TB
Athena, QuickSight, Personalization에서 Data Source로 사용 가능.

Easy DataLake 아키텍처

S3 - Glue - Athena
Glue Crawler - 메타데이터 식별
Glue Data Catalog(feat. Schema)
Athena
S3에 저장된 데이터를 쉽게 분석할 수 있도록 SQL쿼리를 사용하여 데이터를 검색, 분석할 수 있는 서버리스 쿼리 서비스
Log - Kinesis Firehose - S3
Kinesis Agent를 웹서버에 설치 후 수집.
실시간 니즈가 있다면… DMS + Hudi, IceBerg 함께 사용…
배치 작업은 Glue로 처리.
데이터 볼륨이 작다면 Lambda Connector(by Athena)를 통해서 데이터베이스에 연결해서 실시간 데이터 활용 가능.
GA - BigQuery - Glue Connect
GCP 인증 정보 GA 테이블 정보를 파라미터로 넘겨서 연계