드디어 신병훈련소 마지막 날이 밝았다 !!~!~!~!~!~! 박수 👏👏
마지막 날 과제까지 잘~~~~~~~~~~~~ 마무리하고 유종의 미를 거둬야겠다.
오늘은 Tableau Prep Builder를 이용해서 데이터를 정리해보겠다.
4개년 치 매출 데이터와 지역별 관리자, 반품 데이터를 하나로 묶어서 데이터를 분석할 수 있도록 해보자.
먼저 Union과 Join의 개념을 짚고 넘어가보자
UNION
Union은 같은 구조를 가진 집합(테이블)끼리 여러 개를 하나의 집합(테이블)으로 합치는 것을 말한다.
여기서 말하는 같은 구조라 함은 동일한 필드 개수, 필드명, 필드의 데이터 타입을 의미한다.
아래와 같은 형태가 Union이 된다. 데이터가 밑으로 붙는 형태!!
JOIN
Join은 기준 필드를 가지고 조인 형태에 따라, 두 개 이상의 집합을 연결 또는 결합하여 데이터를 출력하는 것을 말한다.
자세한 내용은 [JOIN 하는게 쉬워보이면 그 분은 이미 전문가] / [LEFT AND RIGHT(feat. jungkook of BTS) JOIN] 편 참조
그럼 이러한 개념을 가지고 데이터 정리를 시작해보자
Prep으로 데이터 흐름만들기
1. 영업 실적 2015년부터 2018년도 까지의 데이터를 Union
유니온을 하는 방법은 두 가지가 있다.
- 하나의 파일을 다른 파일 위로 드래그 해서 서로 UNION 하는 방식
- 와일드 카드 유니온을 이용하는 방법
- 드래그 앤 드롭은 유니온을 최대 10개까지만 할 수 있기 때문에 10개보다 많은 파일을 유니온할때는 와일드카드를 이용해서 하는게 더 유용하다.
- 파일 이름이 통일되어 있으니 ‘영업 실적 *년’ 으로 지정하면 여러 개를 유니온 할 수 있다.
- 파일 이름이 통일되어 있으니 ‘영업 실적 *년’ 으로 지정하면 여러 개를 유니온 할 수 있다.
2. UNION한 데이터와 지역별 관리자를 JOIN
3. 조인 1 아이콘을 클릭해서 조인된 결과를 확인
UNION 된 데이터의 지역값과 지역별 관리자의 지역 값을 이용해서 Inner 조인을 하도록 되어있다.
그래서 결과를 보니 1,892건이 제외되고 조인되었다.
일치하지 않는 값을 보니 유니온 1에는 ‘서울경기’라는 값이 있는데 지역별 관리자에는 ‘서울경기’ 값이 없다보니 ‘서울경기’가 조인에 포함되지 않은 것이다.
4. 정리 추가
유니온 1과 조인 1사이에 정리를 추가해준다.
5. 정리1에 지역필드
지역 필드에서 ‘서울경기’ 값을 클릭하고 Table Names 필드를 살펴보니
null 값과 2018년 데이터에만 ‘서울경기’가 포함된 것을 알 수 있다.
6. 값 정리
‘서울경기’는 결국 수도권에 포함된다. 2개의 값을 묶어줘야한다.
‘서울경기’ 이름을 그냥 더블클릭해 ‘수도권’으로 바꿔준다.
7. 반품데이터 조인
8. 조인결과 확인
이번에는 주문 번호 값이 말썽이다.
우리가 원하던 결과가 맞을까?
이게 왜 이렇게 나왔을까..
join은 default로 inner 조인이다.
즉 우리는 왼쪽에 있는 조인1에 데이터를 모두 가져오면서 반품 정보를 결합해야 하니, 조인 형태를 변경해줘야한다.
9. 조인 1의 데이터를 모두 가져오도록 LEFT OUTER JOIN
10. 정리 단계
11. 결합하면서 추가적으로 생긴 필드 제거
‘*-1’ 붙은 필드 제거
12. 분석할 수 있도록 데이터로 출력
13. 출력의 유형
- 파일에 저장 : 자신의 pc에 hyper or csv 파일로 저장
- 게시된 데이터 원본 : 서버에 데이터 원본으로 게시
- 데이터베이스와 CRM Analytics와도 연동 가능
14. 흐름 실행
쨘! 완성
신병훈련소 회고
이상으로 태블로 신병훈련소를 수료해보았다.
사실 무엇인가를 배울때 10일 배우고 마스터할 수 있다고 하면 그건 거짓말일 확률이 크다.
아직은 나도 소 뒷걸음질 치다 쥐 잡은 격으로 이것저것해보다가 "어? 이게 되네??" 이런식으로 할 때가 많다.
하지만 뭔가 태블로에 대한 감을 잡을 수 있었던 것 같다.
이런식으로 하면 될 것 같기도... 한 감ㅎㅎ
아직은 태블로로 데이터를 만지는데 익숙하지가 않아 조금만 답답해도 Data EDA는 주피터 노트북을, prep에서 흐름할때는 DBeaver를 키고 싶은 욕구가 샘솟는다 ㅋㅋㅋ
하지만 사수님께서는 prep이 익숙해지면 이게 훠어어어얼씬 편하다고 하신다.
(연습해야지... 연습만이 살길... 뚜드러 맞다보면 언젠간 나도 편해지지 않을까ㅎㅎ?)
데이터 분야가 정말 넓으니까 정말 내가 어떤 걸 좋아하고 있나 집중해보고 그걸 먼저 해보면 알아서 흥미가 붙고 잘해질수도 있는 것 같다.
모두 화이튕!!
'DI(Digital Innovation) > Tableau' 카테고리의 다른 글
tableau prep 흐름 업데이트 후 Desktop 연동 (1) | 2024.07.23 |
---|---|
태블로 프렙 Oracle 서버 연동 오류 (1) | 2024.06.11 |
태블로 신병훈련소 9일차 (0) | 2024.04.26 |
태블로 신병훈련소 8일차 (0) | 2024.04.25 |
태블로 신병훈련소 7일차 (0) | 2024.04.23 |