데이터 시각화 연습

Jittered boxplot을 이용해 연령분포 확인하기(tableau)

오늘밤공부 2023. 5. 31. 10:27
반응형

Introduction

  • Jittered boxplot을 이용하여 MLB 팀별 연령분포를 확인합니다.
  • Workout Wednesday 2022 week 12(Link)

 

Requirements

  • 대시보드 크기 : 1200 * 800 px
  • 시트 1장
  • 팀의 관계를 통해 두 데이터 소스 연결
  • 팀별 연령 분포를 보여주는 jittered boxplots 만들기
  • 플레이오프 진출 여부(1=진출, 0=없음) 및 일치하는 음영으로 팀을 그룹화
  • 평균 연령별로 팀 정렬
  • 필터를 설정하여 리그 간 전환 또는 모든 팀 표시

 

Result

GIF를 클릭하면 대시보드로 이동합니다.

 

Dataset

  • 데이터셋 : 2021 MLB Age Distribution(Link)
    • 2021 MLB Playoff Team
    • MLB Players 2021

 

Process

더보기

1. "플레이오프 진출 여부"를 확인하기 위한 필드를 생성합니다.

2. 열에 [플레이오프 진출여부], [team] 값을 놓고, 행에 [Age] 값을 놓습니다. 그리고 마크에 [Player Code]를 세부 정보로 설정합니다.

3. 선반에서 [Player Code]와 [team]을 기반으로 계산하는 Index를 생성합니다.

4. 왼쪽의 [분석 - 박스 플롯]을 통해 박스 플롯을 생성합니다.

5. 리그별로 데이터를 확인하기 위해 [League]를 필터로 사용합니다.

6. 왼쪽 정렬된 index값을 임의의 위치로 변경하기 위해 random()함수를 사용하여 필드를 만든 후, index로 가져갑니다.

7. [No Playoff - Playoff] 순으로 되어 있는 시트를 내림차순 정렬하여 [Playoff - No Playoff] 순으로 변경해줍니다. 

8. 서식을 통해 No Playoff에 음영을 넣어줍니다(열 색상 교차에서 구간크기 1칸, 수준 0칸으로 설정).

 

Study

  • random() 함수 : 공식적인 기능이 아니라 나중에 지원되지 않을 수 있지만, 난수를 생성하는데 사용할 수 있음.
반응형