본문 바로가기

전체 글

(56)
[통계] A/B Test 인프런의 거친코딩님의 A/B 테스트 실무자 완벽 가이드 강의를 바탕으로 작성되었습니다. 1. A/B Test란? - 기존 서비스(A)와 새롭게 적용하고 싶은 서비스(B)를 통계적인 방법으로 비교하여, 새롭게 적용한 서비스가 기존 서비스에 비해 더 개선되었는지를 확인하는 방법 - A/B Test를 활용하면 서비스 개선을 위한 인과관계 입증 가능 2. A/B Test의 핵심 원칙 - 조직은 데이터 중심 결정을 내리고, OEC(Overall Evaluation Criterion; 실험 목적의 정량적 측정. e.g 활성 사용자수)를 공식화 작업이 필요 - OEC를 설정하여 A/B Test를 진행할 때, 다음과 같은 사항이 지켜져야 함 1) 단기간 측정: 최대 1~2주안에 테스트 완료해야 됨 2) 개선 변화 차이..
[통계] 데이터 과학을 위한 통계 - 데이터와 표본분포 데이터 과학을 위한 통계를 바탕으로 작성되었습니다. 1. 임의표본추출과 표본편향 - 표본 (sample) : 더 큰 데이터 집합으로부터 얻은 부분집합 - 모집단 (population) : 어떤 데이터 집합을 구성하는 전체 집합 - 임의표본추출 (Random sampling) : 무작위로 표본을 추출하는 것 - 단순임의표본(simple random sample) : 층화 없이 임의표본추출로 얻은 표본 - 층화표본추출 (stratified sampling) : 모집단을 층으로 나눈 뒤, 각 층에서 무작위로 표본을 추출하는 것 - 계층(stratum) : 모집단의 공통된 특성을 가진 하위 그룹 - 표본편향 (sample tias) : 모집단을 잘못 대표하는 표본 2. 통계학에서의 표본분포 - 표본통계량 (sa..
[Tableau] 태블로 신병훈련소 19기 day5 5일차 학습 [5일차 학습] 다양한 맵의 활용: https://www.youtube.com/watch?v=155sbRLr4Cg - 위도, 경도 값을 통해 맵을 표현 5일차 과제 1. 배경 이미지를 이용한 Custom Map 사용하기 - 2호선 역별 평균 승/ 하차 승객수 표현하기 [시각화 과정] 1) X, Y 평균으로 집계하여 각각 열, 행으로 이동 2) 지하철 배경 맵 삽입 맵 → 배경 이미지 → 사용할 데이터 선택: 2호선 역별 승하차인원수 추출 데이터 배경 이미지 삽입 X 필드의 오른쪽과 Y 필드의 위쪽의 숫자는 배경이미지의 사이즈를 입력하면 됨 3) 매개변수 생성 - 측정값을 변수를 선택하는 매개변수 생성 : 평균 승차승객수와 평균 하차승객수 중 하나 4) 계산된 필드 생성 - 파라미터 변경에 따..
[Tableau] 태블로 신병훈련소 19기 day4 4일차 학습 [4일차 학습] 테이블 계산식: https://www.youtube.com/watch?v=dTeBa7jYcpI - 테이블 계산 유형: 행 데이터 → 집계 → 테이블 계산식 전조건: 테이블 계산식에서는 무조건 집계값을 이용해야 태블로는 행 데이터를 통해 집계를 한 다음, 집계 값을 이용해 재계산을 해야 할 때 테이블 계산식을 이용함 4일차 과제 1. 월 별 미세먼지 평균 지수 - 라인차트를 이용하여 월 별 미세먼지 평균 파악하기 [시각화 과정] 기준년월 열 선반으로 이동 → 불연속형 '년'을 연속형 '월' 타입으로 변경 2. 하이라이트 테이블 - 하이라이트 테이블을 이용하여 시도 별 월 별 미세먼지 지수의 패턴 파악하기 [시각화 과정] '기준년월'의 '월'을 열 선반으로, 시도를 행 선반으로 ..
[Tableau] 태블로 신병훈련소 19기 day3 3일차 학습 [3일차 학습] 매개변수 : https://www.youtube.com/watch?v=EispeG1IJ_8&feature=youtu.be 대시보드 동작: https://www.youtube.com/watch?v=YPzX2YvaRbw&feature=youtu.be - 매개변수: 필터 및 참조선에서 상수 값을 동적으로 바꿀 수 있는 변수 - 활용 순서: 매개변수 생성 → 계산식 생성 → 분석에 활용 3일차 과제 1. 매개 변수를 사용하여 측정값 변경하기 1 & 마크 색상 표현하기 - 하나의 시각화에 여러 개의 측정값을 변경해보고, 선택한 카페인 함유량에 따라서 카테고리 색상 표현하기 (측정값: 당류, 카페인, 칼로리) [시각화 과정] 1) 매개변수 생성 - 측정값을 선택하는 매개변수 생성 : 측..
[Tableau] 태블로 신병훈련소 19기 day2 2일차 과제 [2일차 학습] - 행 수준 vs 집계 수준 : https://www.youtube.com/watch?v=R3ldfGrWFGI&feature=youtu.be [2일차 과제: 스타벅스 메뉴 분석2] 1. 워드클라우드 - 워드클라우드를 이용해 가장 '칼로리'가 높은 '메뉴명' 파악하기 [시각화 과정] 1) 메뉴명을 마크: 텍스트로 이동 2) 합계(칼로리)를 마크: 색상, 크기로 이동시켜 칼로리가 높을수록 크고 붉은색으로 표현 2. 박스플롯 - 카테고리 별 메뉴명 수준까지 합계 칼로리 분포를 박스플랏을 통해 시각화 [시각화 과정] 1) 메뉴명, 카테고리, 칼로리 동시 선택 → 표현방식: 상자그림 2) 카페인을 마크: 색상을 통해 카페인이 높을수록 붉은색을 띠게 표현 3. 계산된 필드 만들기 - 평..
[Tableau] 태블로 신병훈련소 19기 day1 참여계기 사실 부끄럽지만 전 신병훈련소가 처음이 아닙니다. 작년 9월에도 한 번 수료한 경험이 있는... 그 당시 약간의 번아웃과 점점 어려워지는 내용에 추가시간에 과제를 겨우겨우 제출했다죠...^^ 그런데 때 마침 저한테 이런 메일이 도착했습니다. 부트캠프를 수강하면서 기초 태블로를 배우기도 했고 더 배우고 싶다 생각하던 저에게 완전 딱 이거다...! 싶은 마음에 냉큼 신청했답니다. 이번에는 당일 주어진 과제를 그날그날 제출하며 블로그에도 기록하겠습니다! 프로그램 소개 우선 태블로 신병훈련소를 모르시는 분들을 위해 간략하게 소개하겠습니다. 1. 일정 이전 기록을 찾아보니 1년에 4번 3,6,9,12월에 일정이 시작되는 거 같습니다. 프로그램 신청을 원하시는 분들이라면 저처럼 미리 태블로 가입을 해 두고..
[패스트캠퍼스] 데이터 분석 부트캠프 8기 솔직후기 2월 말부터 6월 초까지 진행하는 패스트캠퍼스 데이터분석 부트캠프를 무사히 완주했습니다 👏👏👏 처음 수강할 땐 매주 학습일지를 작성해야겠다 마음먹었는데, 본격적인 프로젝트에 들어가면서 제 다짐은 멀리... 후기를 먼저 작성하지만 포폴 작성하면서 여건이 된다면 진행했던 프로젝트 내용도 포스팅하겠습니다 하핳 그럼 다들 궁금해하실 본격적인 후기 시작하겠습니다! 커리큘럼 패스트캠퍼스 데이터분석 부트캠프를 고민 중이신 분들은 아시겠지만, Excel, Python, SQL, Tableau에 대한 교육을 제공합니다. 강의를 수강하면서 받았던 개인적인 감정에 대해 솔직하게 적어보겠습니다. 1. Excel 패스트캠퍼스 데이터분석 부트캠프에서 제일 먼저 제공하는 교육이라 그런지 가장 짜임새 있었던 강의입니다. 강사님께서도..

728x90