3주차 스터디도 2주차 스터디와 마찬가지로 Tableau 기초 강의를 기반으로 진행했다.
데이터는 [학업 성취도]를 사용했다.
1. 데이터 확인하기
일단 데이터의 필드는 gender, race/ethnicity, parental level of education, lunch, test preparation course, math score, reading score, writing score로 구성되어 있었다.
lunch의 의미를 정확히 모르겠는데, 안에 데이터가 free/reduced와 standard로 나뉘어져 있는 걸 보니, 대충 저소득층 구분 필드라는 것을 볼 수 있었다.
참고로 parental level of education의 데이터의 내용은 다음과 같다
- some college : 대학은 다녔지만 학위가 없는 사람(대학 중퇴라고 예상)
- associate's degree : (한국으로 치면) 전문학사
- mater's degree : 박사 학위
- bachelor's degree : 학사 학위
- some high school : some college와 비슷한 개념이라고 생각
2. 데이터 시각화하기
2.1. bar chart로 보여주기 - (1) 부모의 학위와 경제의 상관관계
일단 lunch가 경제 척도 데이터라는 것을 확인 후, 부모의 학위에 따라 현재 경제를 좀 확인하고 싶었다.
일단 lunch로 기준을 나누고, 그 안에서 부모의 학위 수를 count로 줬고, 레이블도 추가했다.
원래 생각했던 결과와는 달라서 흥미로웠던 것 같다.
+) 원래는 정렬하기 전 그래프로 팀원들에게 발표를 했다.
분명 내가 혼자 실습할때는 정렬이 맨 왼쪽 free/reduced에 따라 정렬이 되는 줄 알고 어라 왜케 뒤죽박죽으로 정렬되지? 하면서 정렬을 풀어놨다. 그리고 팀원들에게 정렬이 제대로 안돼서 정렬을 못했다고 하면서 다시 보는데...이게 웬열...제대로 정렬은 된건데 내가 바보같이 착각했던 것이다. 이게 바로 집단 지성의 힘..
2.2. bar chart로 보여주기 - (2) 성별에 따른 준비도와 성적의 차이
위 데이터와 마찬가지로, 성별을 기준으로 나누고, 그 안에서 completed/none, 즉 test preparation course로 나누고, 그 안에서 writing, reading, math score을 보여주도록 나눴다.
여기서 writing, reading, math score의 기본값은 합계, 즉, 조사된 학생들의 성적을 다 더한 값으로 나온다.
때문에 이를 avgerage, 평균 값으로 보여주도록 설정을 해줘야한다.
++) 이것도 사실 각 그래프에 레이블이 붙어있지 않던 상태였다. 내가 할때는 엉망이 되었어서 레이블을 잠시 빼놓았는데 팀원 한분이 상단 메뉴의 [전체보기] - 옆옆에 [마크 레이블 표시]를 누르니까 정상적으로 나왔다. 집단 지성을 연속으로 느낄 수 있었던 나의 발표시간이었다.
3. 3주차 스터디를 마무리 하면서..
사실 최대한 tableau 기초 강의에서 배운 내용을 활용하고 싶었으나, 많이 부족했다.
시간도 조금 촉박해서 원래 계획했던 것들을 다 보여주지 못해서 아쉬웠다.
저번시간에는 다양한 그래프로 시각화 했는데, 이번에는 bar chart로만 구성해서 스스로도 굉장히 아쉬웠다.
또, 각 reading/writing/math 점수 각각의 평균이 아니라, 그룹에 따라 저 셋의 평균을 내고 싶었는데
avg([math score], [writing score], [reading score]) 이런 식으로 함수를 만드니까 계속 오류가 났다.
이부분은 좀 더 구글링을 해봐야겠다.
바뀐 스터디 방식도 좋았다. 다 같이 데이터 분석을 하니까 좀 더 접근하기도 쉬워졌고, 저번주의 나처럼 쓸모있는 데이터를 지나치는 일이 적어진 것 같다. 또 팀원들이 돌아가면서 발표를 하고 그냥 끝내는 것이 아니라 팀원들끼리 조언이나 궁금한 점을 나눴는데, 그 덕분에 나도 내가 지나치거나 몰랐던 점을 발견하게 돼서 굉장히 도움이 됐다.
팀원 발표 중 굉장히 인상적이었던 것은, 한 팀원은 이번에 배운 대시보드로 구현을 했었는데, 그 시각화 내용도 굉장히 괜찮았고, 대시보드도 잘 나와서 기억에 남았다. 배운 것을 바로 활용하는 것이 대단해서, 보는 내내 감탄했던 기억이 난다. 또, 다른 팀원은 reading/writing/math의 점수를 5점 단위의 구간차원으로 나눠 보여줬는데, 그것도 굉장히 흥미로웠다. 이번 스터디 시간에는 내가 너무나도 다른 팀원들보다 부족했던 것 같아서, 다음 시간에는 좀 더 준비를 해서 참여를 해야겠다.
'데이터 사이언스 > 데이터 시각화' 카테고리의 다른 글
[Tableau] 시각화 스터디 with DALC : 4주차 (0) | 2021.03.30 |
---|---|
[Tableau] 태블로 플랜잇 굿모닝 23~34 (0) | 2021.03.29 |
[Tableau] 태블로 플랜잇 굿모닝 12~22 (0) | 2021.03.23 |
[Tableau] 시각화 스터디 with DALC : 2주차 (0) | 2021.03.16 |
[Tableau] 태블로 플랜잇 굿모닝 1~11 (0) | 2021.03.15 |