본문 바로가기

데이터 분석/프로젝트

(9)
유통 데이터를 활용한 리텐션과 RFM 분석(4) 드디어 유통 데이터 분석의 마지막 내용입니다.  분석 목적 3번인 RFM 분석을 진행해 보겠습니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기  6. RFM 분석 RFM 분석은 고객의 가치를 평가하고 세분화하기 위해 사용하는 방법입니다. RFM은 Recency(최근성), Frequency(빈도), Monetary(금액)의 약자로, 각각 고객의 구매 활동을 기반으로 한 세 가지 중요한 지표를 나타냅니다.  - Recency(최근성): 고객이 마지막으로 구매한 시점으로부터 얼마나 시간이 지났는지를 측정. 최근에 구매한 고객일수록 다시 구매할 가능성..
유통 데이터를 활용한 리텐션과 RFM 분석(3) 앞전 포스팅에서 시간의 흐름에 따른 여러 추이에 대해 살펴보았습니다.  이번 내용에서 다룰 내용은 분석 목적 2번인 리텐션 분석입니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기 5. 리텐션(Retetion) 분석리텐션 분석은 고객 유지율을 분석하는 과정으로, 특정 기간 동안 얼마나 많은 고객이 지속적으로 제품이나 서비스를 이용하고 있는지를 측정하는 방법입니다. 본 분석에서는 특정 월에 구매한 고객이 다음 월에도 구매를 했는지에 대해 초점을 두고 분석을 진행해 보겠습니다.    데이터를 다시 살펴보겠습니다.   데이터는 한 영수증 번호에 여러 ..
유통 데이터를 활용한 리텐션과 RFM 분석(2) 이전 포스팅에서 유통 데이터에 대한 소개와 전처리를 진행했습니다. 이번 포스팅에서는 본격적인 분석에 들어가겠습니다.  분석 목적을 다시 한번 정리해 보면 다음과 같습니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기 해당 페이지에서 다룰 내용은 분석 목적 1번입니다.  4. 시간의 흐름에 따른 추이 분석 ① 시간의 흐름에 따라 매출 추이는 어떻게 달라지는가? 매출 추이를 알아보기 전에 전처리가 완료된 데이터를 다시 살펴보겠습니다. InvoiceNo : 영수증 번호StockCode: 상품 번호Description: 상품명Quantity: 판매 수량..
유통 데이터를 활용한 리텐션과 RFM 분석(1) 리텐션 분석과 RFM 분석은 고객 데이터를 이해하고 마케팅 전략을 최적화하는 데 사용하는 방법 중 하나입니다. 오늘은 유통 데이터를 활용해서 이 두 가지 분석론을 진행해 보겠습니다.  1. 데이터 소개분석에 사용한 데이터는 한 유통 회사에서 발생한 2010년 12월 1일부터 2011년 12월 9일까지 판매된 상품에 관한 데이터 입니다.  import pandas as pdimport plotly.express as pxdata = pd.read_csv('ecommerce_data.csv')data.head(10) InvoiceNo : 영수증 번호StockCode: 상품 번호Description: 상품명Quantity: 판매 수량InvoiceDate: 결제 날짜UnitPrice: 개당 가격CustomerI..
[마케팅 데이터 분석] AARRR 실습(1) - Acquisition 데이터 분석을 하시는 분들이라면 AARRR에 대해 많이들 알고 계실 거라 생각합니다. 특히 DA를 희망하시는 분들이라면 채용공고에 자격 요건으로도 한 번씩 보셨을 거 같은데요. 저 또한 대략적인 개념은 알고 있지만 전체적인 내용에 대한 정리가 필요하다 판단하여 해당 글을 작성합니다. 실습 내용은 패스트캠퍼스의 직장인을 위한 파이썬 데이터분석 올인원 패키지를 참고하였습니다. 1. 데이터 설명 및 문제 정의 분석에 사용한 데이터는 캐글에 있는 미디어별 광고비와 매출 데이터입니다. (https://www.kaggle.com/datasets/sazid28/advertising.csv) TV: TV 매체비 radio: 라디오 매체비 newspaper : 신문 매체비 sales: 매출액 우선 분석을 하기전 정리해야..
[논문] Encoder Decoder 알고리즘을 이용한 시계열 자료 예측 대학원을 다닐 때 작성한 학위논문입니다. 다시 읽어보니 급하게 작성한 티가 나기도 하고 서술이 불친절한거 같아 부족한 내용을 추가하고 정리하는 의미에서 작성합니다. (Notion에 정리한 내용을 그대로 복사한 거라 어체가 다른 점 양해 부탁드립니다. 추후에 수정하겠습니다.) Encoder Decoder 알고리즘을 이용하여 5일 후의 시계열 자료 예측을 진행하였다. 여기서 인코더 디코더란 두 종류의 시퀀스 데이터 간의 관계를 학습하는 알고리즘 중 대표적인 알고리즘이라고 할 수 있다. (시퀀스란 순서가 있는 데이터로 독립적이지 않고 서로 연결되어 있는 데이터 구조를 의미. 예를 들면 주식, 언어 등이 이에 해당한다 할 수 있다.) 본 연구에서 사용한 시계열 데이터는 경남 소재 가스 생산설비에서 관측된 바이오..
[생존분석] R을 이용한 백혈병 환자 데이터 분석 생존분석 수업을 듣고 진행한 백혈병 데이터 관련 분석입니다. 주제는 백혈병 환자의 골수이식 방법에 따른 비모수적, 모수적, 준모수적 접근 방법의 생존시간 비교입니다. 과거 분석한 내용을 다시 정리하는 거라 흐름이 조금 매끄럽지 않을수도 있고 의학 데이터를 처음 다뤄봐서 부족하지만 재미 삼아 봐주세요! (사용한 데이터와 코드는 추후에 추가하겠습니다.) 1. 서론 백혈병이란 백혈구가 이상 증식하는 혈액종양의 일종으로, 제대로 성숙하지 못한 백혈구가 대량으로 혈액 속에 존재하는 것을 말한다. 백혈구의 비정상적인 증식에 비해 정상적인 혈구 세포의 수가 극히 적어지게 되면 면역기능 약화, 산소 운반, 영양 공급 등 기본적인 혈액의 기능을 수행할 수 없게 되는 문제가 발생한다. 백혈병 환자의 골수이식 종류는 크게 ..
위드(with)코로나 시대 소비 변화 - 번외 데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다. 앞의 포스팅에 번외적인 내용까지 한번에 담기엔 너무 길어 나눠서 작성합니다! 이전 내용은 아래 링크로 이동하시면 됩니다. https://data-gongbu.tistory.com/9 위드(with)코로나 시대 소비 변화 데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다. 코로나가 확삼됨에 따라 소비 패턴이 변화하는 것을 월별 매출의 증감을 통해 파악해보자는 취지에 의해 분 data-gongbu.tistory.com 택시의 매출건수로 보는 코로나19 회현동에서는 월요일마다 도대체 무슨일이? '관광' 카테고리에서 매출 건수를 자세히 들여다보니, 매출 건수가 유독 많은 업종이 있었습니다. 특히, 특정 지역..

728x90