Search
📁

부스트코스 - 데이터 시각화를 위한 태블로 강의 정리

측정값, 차원

태블로의 가장 기본 컨셉 중 하나는 측정값과 차원입니다.
측정값은 기본적으로 숫자형식이고 집계를 통해 한 덩어리가 만들어지며,
차원은 그 한 덩어리를 세부적으로 나누어서 보는 기준이 됩니다.
또한 태블로에서 가장 기본적인 비주얼리제이션은 막대 차트입니다.
태블로에서는 측정값에 있는 데이터 원본 필드 중초록색 연속형 필드(지리적 역할인 위도, 경도는 제외)를 더블 클릭하면기본적으로 막대 차트가 만들어집니다.
기본적으로는 집계 방식을 통해 우선 차트를 만들고이것을 분할해서 보는 기준은 차원의 값으로 결정되는데,그 출발은 막대 차트부터 시작하게 됩니다.

불연속형, 연속형

태블로에서는 데이터 원본의 열(Column)에서 만들어진 필드를  불연속형(파란색)인지, 아니면 연속형(녹색)인지에 따라 뷰에서 다르게 표시하게 됩니다.
예를 들어서 연속형은 무한대로 끊어지지 않고 이어지는 성격이라면, 불연속형은 값은 유한하며 개별적으로 구분되는 속성이 있습니다.

불연속형

파란색 필드 = 불연속형 = 개별적으로 구분
유한한 범위, 뷰에 추가하면 머리글을 추가함
Discrete = Blue, Separate and distinct, finite
Discrete fields draw headers.

연속형

초록색 필드 =연속형 = 단절이 없고 끊어지지 않는무한대 범위, 뷰에 추가하면 축을 추가합니다.
Continuous = Green, unbroken, without interruption, infinite
Continuous fields draw axes.
라인 차트는 처음부터 해당 영역까지 기본적으로 연결하는 속성이 강합니다.
따라서 시간 베이스의 추세를 살펴보는데 적합합니다.
라인 차트에도 불연속형과 연속형이 있으며, 각각 적용되는 함수도 다르고 뷰에서 표현하는 방식도 다릅니다.
라인 차트는 전반적인 추세를 보는 경향이 강한 차트이며,
불연속형은 DATEPART 함수를, 연속형은 DATETRUNC 함수가 적용됩니다.

부분 전체 분석

전체에서 각각의 멤버들의 값이 어느 정도의 비율을 차지하는지 살펴보는데 적합합니다.
다만, 멤버가 많은 경우에는 파이 차트나 도넛 차트 구성은 가급적 피하는 것이 좋으며
이 경우에는 트리맵을 대안으로 적용해보시기 바랍니다
누적 막대 차트 (Stacked Bar chart)
파이 차트 (Pie chart)
도넛 차트 (Donut chart)
트리맵 (Treemap)
퀵 테이블 계산 (Quick Table calculation)
구성 비율 (Percent of Total)

분산형 차트 (Scatter plot)

측정값 간의 관계를 파악하기 위한 시각화의 한 방식입니다.
열 선반과 행 선반에 각각 측정 값을 배치하면 자동적으로 분산형 차트가 만들어집니다.
열 선반과 행 선반에 올리는 필드는 고정적으로 배치가 가능하지만, 좀 더 자유도를 주고자 별도의 매개 변수를 만들면 매개 변수 값에 따라 분산형 차트를 다양하게 활용할 수 있습니다.
데이터 설명 및 매개 변수와 함께 활용하시면 좀 더 다양한 결과를 확인하실 수 있습니다

이중 축 (Dual Axis)

하나의 뷰 안에서 축을 이중으로 써서 차트를 만드는 경우이며
이중 축은 마크를 서로 다르게 구성이 가능합니다.

결합된 축 (Combined Axis)

하나의 뷰에서 같은 축을 결합 또는 공유하는 케이스이며
결합된 축은 마크가 동일하게 구성됩니다.

그룹

항목들을 여러 그룹으로 묶을 수 있지만

집합

집합에 포함(IN)되는지 아닌지(OUT)으로만 구분합니다.
또한 집합을 두 개 만든 다음에 이들을 결합해서 별도의 집합으로 만들 수 있습니다.
이 때 벤다이어그램 기준으로 집합의 모습에 따라 교집합, 합집합, 여집합으로 결합된 집합을 활용할 수 있습니다.

계층(hierarchy)

화면에서 드릴 다운(Drill-down)해서 값을 세부적으로 찾는 데 유용합니다.

총계(Total)

각각의 요소들의 총 값을 보여주는 방식으로 범위에 따라
총합계 및 소계, 그리고 열과 행 기준으로 각각 TOTAL을 표시할 수 있습니다.

태블로 맵

Tableau에서는 맵 형태로 데이터를 표현할 수 있습니다.
우리나라 지리 정보가 있다면 기본적으로는 시도와 시군구명만 있더라도
태블로에서 맵 형태로 표현이 가능합니다.
또한 시군구 기준으로는 같은 이름이 있는 경우에는 맵에서 제대로 표현하기 위해
상위 레벨인 시도와 계층을 설정하는 것이 중요합니다.
그 외에 읍면동이라든지 지점 위치를 표현하고 싶다면
위도와 경도 값을 갖고 있거나,
별도의 공간 파일(shp파일)과 조인해서 표현 가능합니다.

대시보드 (Dashboard)

대시보드란?
첫 번째는 복수개의 시트로 구성되며
두 번째는 시트들간 상호 작용이 존재하고,
세 번째는 발견 -> 탐색 -> 인사이트를 구하는 과정이 있습니다.
대시보드 제작 시 고려사항으로는
대시보드를 누가, 어디서, 왜! 보는지에 따라
화면 구성은 달라집니다.

스토리 (Story), 스토리텔링 (Storytelling)

스토리(Story)란
하나의 시트로, 대시보드나 워크시트를 추가할 수 있습니다.
이 시트에는 본인이 만든 데이터 시각화를 순서대로 설명할 수도 있고, 본인이 찾은 인사이트를 추가할 수 있습니다.
또한 미팅이나 발표시에 프레젠테이션 모드로 설정하고 하나의 스토리를 이어가도록 흐름을 설정할 수도 있습니다.
스토리텔링을 잘하기 위해서 다음 사항에 관심을 가집니다.
1) 누구를 위한 스토리인가, 청중이 관심 있는 내용인가
2) 스토리 포인트간 플로우를 잘 기획했는가
3) 데이터 시각화와 스토리 포인트가 일치하는가
4) 청중이 중간에 이탈하지 않고 스토리가 잘 전개되고 있는가
5) 스토리를 불러오는데 로드 없이 구성되어 있는가
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.12 스토리 만들기.pdf
660.3KB

퀵 테이블 계산 (Quick Table Calculation)

퀵 테이블 계산은 데이터 시각화에서 빠르게 적용할 수 있는 테이블 계산으로,
기존 테이블 계산을 사용해도 동일한 설정을 할 수 있지만 직접 계산식을 적용해야 하는 반면에,
퀵 테이블 계산은 클릭만으로 테이블 계산을 손쉽게 적용할 수 있습니다.

누계 (Running Total) 

각각의 값을 누적해서 보는 개념입니다.

차이 (Difference) 

앞의 항목과 어느 정도 차이가 나는지를 구하는 것입니다.

구성 비율 (Percent of Total) 

전체에서 각 멤버들의 비중을 확인할 때 활용합니다.

순위 (Rank) 

각 멤버들의 측정값을 기준으로 순위를 나타낼 때 사용합니다

비율 차이 (Percent Difference) 

측정값들 사이의 성장률 또는 % 차이입니다

전년 대비 성장률 (Year Over Year Growth)

같은 월을 기준으로 이전 연도 대비 얼마 정도 성장했는지를 살펴보는데 활용합니다.

백분위수 (Percentile)

전체에서 각 멤버들의 백분위를 표시합니다. 상위와 하위로 각각 기준을 변경할 수 있습니다.

이동 평균 (Moving Average)

이전의 값부터 현재까지 값에 대한 평균을 낼 때 사용하며 주식 데이터에서 많이 활용합니다.

YTD 총계 (Year To Date Total)

특정 시점을 기준으로 해당 연도부터 그 시점까지 총계를 말합니다

계산된 필드 만들기 (Create Calculated Field)

태블로에서 다양한 형태의 뷰를 만들고 분석하고 싶을 때 데이터 원본에 없는 필드를 직접 만들 수 있습니다.
간단한 계산식부터 복잡한 계산식을 태블로에 내장되어 있는 함수를 활용해 만들 수 있습니다.
또한 효율적인 계산 만들기는 반드시 체크하셔서 각자 만든 화면의 성능을 개선할 수 있는지 살펴보는 것도 좋습니다
그러면 왜 [매출 2억 구분_T/F]가 앞서 만든 IF와 IIF보다 더 좋을까요?
반드시 그런 것은 아니지만 지금과 같이 특정한 기준을 두고
A or B 인 경우에는 지금과 같이 True or False인 ‘T|F’ 유형이 좋습니다.
이유는 태블로 온라인헬프 페이지에 있는 ‘효율적인 계산 만들기’ 페이지를 참고하시기 바랍니다.
부울 및 정수로 속도 향상

매개 변수 (Parameter)

매개 변수는 혼자서 쓸 수 없고
반드시 계산식, 필터 그리고 참조선과 연동을 해야 상수 값을 동적인 값으로 변경할 수 있습니다.
허용 가능한 값으로는 전체, 목록, 범위형이 있으며
데이터 유형이 문자열인 경우에는 범위형은 비활성화 됩니다.
분산형 차트는 측정값 간의 관계를 파악하기 위한 시각화의 한 방식입니다.
열 선반과 행 선반에 각각 측정 값을 배치하면 자동적으로 분산형 차트가 만들어집니다.
열 선반과 행 선반에 올리는 필드는 고정적으로 배치가 가능하지만, 좀 더 자유도를 주고자 별도의 매개 변수를 만들면 매개 변수 값에 따라 분산형 차트를 다양하게 활용할 수 있습니다.
데이터 설명 및 매개 변수와 함께 활용하시면 좀 더 다양한 결과를 확인하실 수 있습니다

태블로 작업 순서 (또는 작동 순서, Order of Operations)

태블로 내에서 다양한 동작을 수행하는 순서를 나타냅니다.
쿼리 파이프라인이라고도 하는데, 뷰를 작성할 때 사용하는 필터의 종류에 따라 작업 (작동) 순서가 결정됩니다.
태블로 데스크탑 기준으로는 ‘추출 필터’가, 태블로 퍼블릭 기준으로는 데이터 원본 필터가 최상위 레벨입니다.
워크시트 기준으로는 컨텍스트 필터가 가장 높은 레벨의 필터입니다.
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.18 태블로 작업 순서.pdf
578.3KB

인터랙티브 대시보드 (Interactive Dashboard)

Tableau의 시각 분석의 핵심으로, 사람들이 더 빨리 인사이트를 얻고 더 많은 질문을 할 수 있도록 해줍니다.
1.
대시보드 동작
Interactive Data Visualization의 핵심으로 사람들이 더 빨리 질문하고 답을 찾을 수 있도록 해줍니다.
1.
필터 (Filter)
원본 시트 기준으로 대상 시트를 드릴 다운 형식으로 값의 범위를 제한 두도록 설정할 수 있습니다.
1.
하이라이트 (Highlight)
대시보드 내 타겟 시트의 영역을 강조하는 하이라이팅 표시를 합니다.
1.
URL로 이동
대시보드 내 특정 마크를 선택하면 설정되어 있는 값을 따라 웹 페이지로 이동하도록 안내합니다.
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.19 대시보드 액션 적용하기_1.pdf
232.6KB
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.20 대시보드 액션 적용하기_2.pdf
241.5KB

효율적인 대시보드 만들기

부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.21 효율적인 대시보드 만들기_1.pdf
487.5KB
스윗 스팟 (Sweet Spot)은 사람들이 특정한 화면을 보고
시선이 가장 먼저 그리고 가장 많이 가는 곳을 말합니다.
대시보드를 구성하는 우리들이 공략할 곳은 바로 이 스윗 스팟 영역입니다.
기본적으로 사람들의 시선이 가장 먼저 가는 곳은 좌측 상단 영역입니다.
그리고 그 주변을 시작해서 넓게 퍼지게 됩니다.
사람들의 시선이 분산되지 않도록 색상과 View 수는 제한을 두는 것이 좋습니다.
또한 보는 사람이 직접 참여할 수 있도록 매개 변수 및 필터 등을 사용할 수 있도록 가이드를 주는 것도 고려해보세요.
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.22 효율적인 대시보드 만들기_2.pdf
427.9KB
보(고 받)는 사람이 원 페이지로 보길 원하는 경우 예시입니다.
이 경우에는 한 페이지에 모든 정보가 표시되어야 합니다.
그런데 많은 내용을 한꺼번에 담을 경우 사람들의 시선이 분산될 수 있고,
또한 다양한 View로 인해 복잡해질 수 있습니다.
여기에서는 고객들을 분산 형태로 표시한 다음에 각 고객별 정보를
Viz in tooltip (도구 설명 비주얼리제이션) 기능을 활용해 세부 항목을 표시합니다.
여러분들도 표면에 드러난 내용만 보지 마시고,
drill-down하면서 세부적인 정보를 탐색하도록 연습해보세요.
부스트코스_Tableau 활용한 데이터 시각적분석_강승일_Ep.23 효율적인 대시보드 만들기_3.pdf
896.3KB