본문 바로가기

데이터 분석

(25)
[코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발 3주차 과제 해당 포스팅은 [코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발을 수강하면서 했던 과제를 업로드한 것입니다. (본 코드는 MySQL 5.7 환경에서 작성되었습니다.) 더보기 데이터 소개 가상의 Northwind 식품회사의 데이터 DB는 직원, 고객, 상품, 주문, 발주 등 총 20개의 테이블로 구성됨 데이터의 경우 2006년 1월부터 6월까지의 주문에 관한 데이터로 구성 테이블 소개 products : 식품회사에서 취급하는 상품 정보를 담은 테이블. 45개의 레코드가 존재. 제품 코드, 제품명, 가격, 카테고리 등을 보여줌. orders : 고객이 주문한 정보를 담은 테이블. 2006년 1월부터 6월까지의 주문에 관한 데이터로 총 48개의 레코드가 존재. 고객이 어떤 직원에..
[코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발 2주차 과제 해당 포스팅은 [코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발을 수강하면서 했던 과제를 업로드한 것입니다. (본 코드는 MySQL 5.7 환경에서 작성되었습니다.) 데이터 소개 가상의 Northwind 식품회사의 데이터 DB는 직원, 고객, 상품, 주문, 발주 등 총 20개의 테이블로 구성됨 데이터의 경우 2006년 1월부터 6월까지의 주문에 관한 데이터로 구성 테이블 소개 products : 식품회사에서 취급하는 상품 정보를 담은 테이블. 45개의 레코드가 존재. 제품 코드, 제품명, 가격, 카테고리 등을 보여줌. orders : 고객이 주문한 정보를 담은 테이블. 2006년 1월부터 6월까지의 주문에 관한 데이터로 총 48개의 레코드가 존재. 고객이 어떤 직원에게 주문..
[코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발 1주차 과제 해당 포스팀은 [코멘토] SQL 입문부터 활용까지 - 데이터 분석 보고서 작성과 대시보드 개발을 수강하면서 했던 과제를 업로드한 것입니다. 1주차 과제는 w3scholls의 database를 활용했습니다. https://www.w3schools.com/sql/trysql.asp?filename=trysql_select_all SQL Tryit Editor v1.6 WebSQL stores a Database locally, on the user's computer. Each user gets their own Database object. WebSQL is supported in Chrome, Safari, Opera, and Edge(79). If you use another browser you wi..
[그로스해킹] 전제조건 PMF (Product-Market Fit) 이 글은 양승화님의 그로스 해킹 강의를 바탕으로 작성한 글입니다. 흔한 서비스 출시 과정 서비스의 출시는 아이디어에서부터 시작한다. 서비스를 출시하기 위해 팀을 꾸려 Product을 생성 시작하여 6개월 후에 개발되었다고 생각해 보자. 이때 곧 출시를 할 수 있을 거라 생각하지만 문제 발생으로 예상보다 늦게 런칭이 되는 게 대부분이라고 한다. 런칭을 했다고 해서 끝은 아니다. 성과가 좋지 않다면 관련 매체에 보도자료나 인터뷰와 같은 홍보를 시작한다. 이때 홍보 때문에 유저가 생성돼도 대부분이 며칠 쓰다가 나가버린다면? 다시 투자를 해서 마케팅을 하고, 마케팅으로 인한 유저가 생성되고 또 그 유저가 나간다면 이제 기업에선 뭘 해야 하나. 이 서점에서 할 수 있는 가장 나쁜 선택은 '지금은 원래 하려던 기능..
[그로스해킹] 그로스 해킹 그로스 해킹(Growth Hacking)의 개념 Growth는 모두가 알고 있듯이 '성장'이라는 뜻이다. 여기서 Hacking은 시스템에 침입해 정보를 빼내는 일을 말하는 것이 아닌 hack의 다른 뜻 'manage; cope'의 의미로 어떤 문제를 '해결'한다는 뜻이다. 즉, '성장을 위한 데이터 기반 문제 해결 방법론'을 의미한다. 그로스 해킹(Groth Hacking) 의 과정 1. 근거 기반 가설 설정 2. 합리적이고 투명한 기준을 근거로 한 우선순위 설정 3. 실험 4. 실험 결과를 토대로 한 의사결정 그로스 해킹은 데이터에 기반해 소비자와 가장 밀접한 문제를 파악하고 해결해 고객의 니즈를 충족시키는 마케팅 기법이다. 그로스 해킹을 하기 위해선 우선 서비스와 제품에 대한 소비자 기반 데이터 분석..
[논문] Encoder Decoder 알고리즘을 이용한 시계열 자료 예측 대학원을 다닐 때 작성한 학위논문입니다. 다시 읽어보니 급하게 작성한 티가 나기도 하고 서술이 불친절한거 같아 부족한 내용을 추가하고 정리하는 의미에서 작성합니다. (Notion에 정리한 내용을 그대로 복사한 거라 어체가 다른 점 양해 부탁드립니다. 추후에 수정하겠습니다.) Encoder Decoder 알고리즘을 이용하여 5일 후의 시계열 자료 예측을 진행하였다. 여기서 인코더 디코더란 두 종류의 시퀀스 데이터 간의 관계를 학습하는 알고리즘 중 대표적인 알고리즘이라고 할 수 있다. (시퀀스란 순서가 있는 데이터로 독립적이지 않고 서로 연결되어 있는 데이터 구조를 의미. 예를 들면 주식, 언어 등이 이에 해당한다 할 수 있다.) 본 연구에서 사용한 시계열 데이터는 경남 소재 가스 생산설비에서 관측된 바이오..
[생존분석] R을 이용한 백혈병 환자 데이터 분석 생존분석 수업을 듣고 진행한 백혈병 데이터 관련 분석입니다. 주제는 백혈병 환자의 골수이식 방법에 따른 비모수적, 모수적, 준모수적 접근 방법의 생존시간 비교입니다. 과거 분석한 내용을 다시 정리하는 거라 흐름이 조금 매끄럽지 않을수도 있고 의학 데이터를 처음 다뤄봐서 부족하지만 재미 삼아 봐주세요! (사용한 데이터와 코드는 추후에 추가하겠습니다.) 1. 서론 백혈병이란 백혈구가 이상 증식하는 혈액종양의 일종으로, 제대로 성숙하지 못한 백혈구가 대량으로 혈액 속에 존재하는 것을 말한다. 백혈구의 비정상적인 증식에 비해 정상적인 혈구 세포의 수가 극히 적어지게 되면 면역기능 약화, 산소 운반, 영양 공급 등 기본적인 혈액의 기능을 수행할 수 없게 되는 문제가 발생한다. 백혈병 환자의 골수이식 종류는 크게 ..
위드(with)코로나 시대 소비 변화 - 번외 데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다. 앞의 포스팅에 번외적인 내용까지 한번에 담기엔 너무 길어 나눠서 작성합니다! 이전 내용은 아래 링크로 이동하시면 됩니다. https://data-gongbu.tistory.com/9 위드(with)코로나 시대 소비 변화 데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다. 코로나가 확삼됨에 따라 소비 패턴이 변화하는 것을 월별 매출의 증감을 통해 파악해보자는 취지에 의해 분 data-gongbu.tistory.com 택시의 매출건수로 보는 코로나19 회현동에서는 월요일마다 도대체 무슨일이? '관광' 카테고리에서 매출 건수를 자세히 들여다보니, 매출 건수가 유독 많은 업종이 있었습니다. 특히, 특정 지역..

728x90