본문 바로가기

데이터 사이언스/데이터 시각화

(16)
[Tableau] 시각화 스터디 with DALC : 5주차 중간고사 전 마지막 스터디를 진행했다. 데이터는 [업종-지역별 배달] 데이터를 사용했다. 1. 데이터 확인하기 데이터는 사진과 같이 구성되어 있었다. 원래는 날짜 반환과 요일 열은 없었는데, 팀원 한 분이 의견 제시를 해주셔서 바로 엑셀로 함수를 만들어서 넣어봤다. 사용한 함수는 다음과 같다. 날짜 반환 : =WEEKDAY(A2) 요일 : =CHOOSE(B2, "일","월","화","수","목","금","토") 2. 데이터 시각화 하기 데이터를 보면서 분석과 어떤 시각화를 할지 의견을 나눴다. 결론적으로 다음 7개 정도의 시각화 주제가 나왔다. 지역별 평균 배달 소요시간 계산 > 어떤 지역이 성격이 급할까? 코로나 전후의 배달 건수 확인 각 지역별 선호 음식 업종별 평균 주문 금액 위치로 할 수 있는 것..
[Tableau] 태블로 플랜잇 굿모닝 35~44 태블로 플랜잇 굿모닝 23~34에 이어 쓰는 글이다. [더보기] 란에서 볼 수 있듯이, 관련된 자료는 tableau public에서 다운받을 수 있다. 35. 축을 상단에만 표현하는 방법(이중 축 활용) - [분기]는 불연속형, 분기 데이터로, 집계(2018과 2019)는 이중축으로 설정 후, [축 동기화] - 색상은 2018년 매출은 [시애틀의 회색]의 밝은 회색, 2019년 매출은 어두운 회색 설정 - [2019 매출] 데이터의 크기를 조금 좁혀줄 것 - 하단의 축 선택 후 [축 편집] > 1. 축제목 삭제 2. [주 눈금선] : 없음 3. [보조 눈금선] : 없음 설정 - 상단의 축 선택 후 [축 편집] > 축 제목 "매출"로 설정 - [행과 열 바꾸기]로 확인 36. 머리글을 시트 하단에 배치하는..
[Tableau] 시각화 스터디 with DALC : 4주차 이번 주 스터디도 전과 마찬가지로 Tableau 기초 강의를 토대로 진행됐다. 데이터는 [뉴욕시의 에어비엔비] 데이터를 사용했다. 1. 데이터 확인하기 일단 데이터는 아래 사진과 같이 구성되어 있었다. 각 필드에 대한 간단한 설명을 덧붙이겠다. - neighbourhood_group / neighbourhood : 뉴욕시 안의 자치구 / 자치구 안의 또 작은 지역 분류 - latitude : 위도 - longtitude : 경도 - room_type : 룸 타입으로 , Entire home/apt, Private Room, Shared Room 이렇게 세 타입으로 나뉨 - minimum_nights : 예약시 최소 숙박일 - number_of_reviews : 리뷰 갯수 - last_review : 최신..
[Tableau] 태블로 플랜잇 굿모닝 23~34 태블로 플랜잇 굿모닝 12~22에 이어 쓰는 글이다. 23. PDF 파일 데이터 연결_Tableau 주식 데이터 살펴보기 - 변화가 큰 데이터는 굵기를 달리하여 주목도 설정하기 - pdf 파일의 범위를 지정 가능 - [새 유니온] - [와일드카드(자동)] - [Page*]를 이용해, page1부터 25까지 이어붙이기 - 원하지 않는 필더는 [숨기기] 지정 및 원하는 필드의 데이터 형식 정하기 - [계산된 필드 만들기]로 다음과 같이 입력 Fluctuation ABS(SUM([Close])-LOOKUP(SUM([Close]), -1)) - Fluctuation을 [마크]-[크기] 위로 드래그 후 [주석 추가]-[지정]하여 메세지 주기 24. 데이터 원본 저장이란? - 데이터 원본은 (.tds)의 형태로 되..
[Tableau] 시각화 스터디 with DALC : 3주차 3주차 스터디도 2주차 스터디와 마찬가지로 Tableau 기초 강의를 기반으로 진행했다. 데이터는 [학업 성취도]를 사용했다. 1. 데이터 확인하기 일단 데이터의 필드는 gender, race/ethnicity, parental level of education, lunch, test preparation course, math score, reading score, writing score로 구성되어 있었다. lunch의 의미를 정확히 모르겠는데, 안에 데이터가 free/reduced와 standard로 나뉘어져 있는 걸 보니, 대충 저소득층 구분 필드라는 것을 볼 수 있었다. 참고로 parental level of education의 데이터의 내용은 다음과 같다 - some college : 대학은 ..
[Tableau] 태블로 플랜잇 굿모닝 12~22 태블로 플랜잇 굿모닝 1~11에 이어 쓰는 글이다. 12. 수익 구간차원 만들기 - [수익] 옵션에서 [만들기] - [구간차원] 선택 후, 수익 구간차원_$200으로 명명 후, 구간 차원 크기를 200으로 줌 - 생성된 [수익 구간차원_$200]을 [열] 선반 위로 드래그 - [행] 선반의 [고객 이름]을 마우스 오른쪽 클릭 후, [측정값] - [카운트(고유)] 선택 - [마크] 패널 위 기존 필드는 제거 후, [너비 맞추기]로 보기 변경 - [행] 선반의 [카운트(고유)(고객이름)]을 ctrl 눌러 복사 후 [마크] 패널 위 [레이블]에 드래그앤 드랍 - 레이블에 오른쪽 마우스 클릭 후, [레이블 회전] 후, [서식] - [숫자] - [숫자(표준)] 변경 - 맨 왼쪽의 머리글 해제 - [카운트(고유)(..
[Tableau] 시각화 스터디 with DALC : 2주차 2주차 스터디에서는 앞서 Tableau 기초 강의를 들은 것을 기반으로 진행했다.데이터는 [서울시 코로나19 확진자 현황]을 사용했다. 1. 데이터 확인하기일단 데이터의 필드는 연번, 확진일, 지역, 여행력, 접촉력, 조치사항, 등록일, 수정일, 노출여부로 구성되어 있었다.유효한 데이터는 확진일, 지역, 여행력이라고 생각을 했다. +) 다른 친구들이 한 것을 보니 접촉력으로도 많은 결과를 보여줄 수 있었다. 유효 데이터인데 왜 그냥 지나쳤는지...좀 더 데이터를 잘 확인해야겠다는 생각이 들었다. 2. 데이터 시각화하기2.1. 시계열 데이터로 보여주기일단 확진일을 메인으로 날짜에 대한 확진자의 수 변화를 보고 싶었다.서울시 코로나19 확진자 현황 카운트를 확진일에 따라 보고 싶었기 때문에 확진자 카운트와 ..
[Tableau] 태블로 플랜잇 굿모닝 1~11 tableau 기초 유튜브를 보며 정리한 내용이다. www.youtube.com/watch?v=qDijvpoCSGc&list=PL6ICdBRB3Rx1ME7YB0O4Aik-mqtXJrBhU 동영상에서 사용한 실습 데이터는 다음 URL에서 다운 받을 수 있다. public.tableau.com/profile/planit.datav#!/ 1. 3초 만에 막대 차트 만들기 - 차원 : 측정값들을 기준으로 어떻게 잘라서 보여줄지 결정하는 곳 - 측정값 : 일반적으로 숫자 형태 - [행과 열 바꾸기] 기능 확인하기 - 축 옆에 [정렬] 버튼으로 내림차순, 오름차순 정렬 확인 - 색깔 변경 해보기: 원하는 필드 값 선택 후, [마크] 탭의 [색상] 탭 클릭. 색은 커스텀 변경도 가능. 2. 라인차트로 매출 추이 살펴..