데이터 분석 (28) 썸네일형 리스트형 [Python] 부동산 데이터를 활용한 최적의 자취방 구하기(2) 이전 포스팅에서 크롤링을 통해 원하는 부동산 데이터를 수집했습니다. 이번 포스팅에서는 수집된 데이터를 이용해 최적의 자취방을 구해보겠습니다. 2. 조건 구체화최적의 자취방을 구하기 위해 설정한 세부 조건은 다음과 같습니다. ✔️ 보증금 3000만 원 이하✔️ 월세는 저렴할수록 좋음✔️ 지하, 반지하, 꼭대기층은 선호하지 않음✔️ 전용면적이 클수록 좋음✔️ 북향은 선호하지 않음✔️ 연식이 오래되지 않을수록 좋음✔️ 지하철역에서 가까울수록 좋음 3. 데이터 전처리분석을 진행하기 위해 전처리를 진행하겠습니다. import pandas as pdimport numpy as npdata = pd.read_excel('부동산데이터.xlsx')data.head(3) data.info() 데이터는 총 186.. [Python] 부동산 데이터를 활용한 최적의 자취방 구하기(1) 크롤링(Crawling)은 웹에서 자동으로 데이터를 수집하는 기술을 말합니다. 이번 프로젝트에서는 크롤링을 통해 부동산 데이터를 수집하고, 이를 활용하여 조건에 맞는 자취방을 구하는 것을 진행해 보겠습니다. 1. 데이터 소개 및 수집분석에 사용한 데이터는 네이버 부동산에서 서울시 관악구에 있는 월세 형태의 오피스텔 ·빌라 ·원룸 형태의 매물들입니다. 데이터는 네이버 부동산 모바일 버전 (https://fin.land.naver.com/?content=recent)을 통해 수집하겠습니다. [크롤링 대상 데이터] 저희에게 필요한 데이터는 페이지 오른쪽에 위치한 빨간 박스 안의 매물 정보입니다. 1) URL 분석 영상과 같이 개발자 도구 - 도구 더보기에 들어가 network를 누른 후, 매물들.. [Python] 사용자 행동 로그 데이터를 활용한 퍼널 분석 퍼널 분석(Funnel Analysis)은 고객이 유입되고 전환에 이르기까지 주요 단계를 수치로 확인하는 분석 방법입니다. 전환에 이르는 고객 경험 과정을 단계별로 나누어 언제, 어디서, 어떻게 이탈하는지를 파악해 개선점을 찾아 전환율을 높이기 위한 목적을 가지고 있습니다. 이러한 퍼널 분석은 비즈니스 성과를 향상시키는데 중요한 역할을 하기 때문에 이번 분석에서 사용자 행동 로그 데이터를 통해 분석을 진행해 보겠습니다. 1. 데이터 소개한 전자 상거래 웹사이트에서 2020년 1월에 수집된 데이터로, 고객이 상품을 조회하고 구매해난 과정에서 발생한 로그 데이터입니다. event_time : 이벤트가 발생한 시각event_type: 이벤트의 종류view: 상품을 조회한 경우cart: 상품을 장바구니.. [Python] 유통 데이터를 활용한 리텐션과 RFM 분석(4) 드디어 유통 데이터 분석의 마지막 내용입니다. 분석 목적 3번인 RFM 분석을 진행해 보겠습니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기 6. RFM 분석 RFM 분석은 고객의 가치를 평가하고 세분화하기 위해 사용하는 방법입니다. RFM은 Recency(최근성), Frequency(빈도), Monetary(금액)의 약자로, 각각 고객의 구매 활동을 기반으로 한 세 가지 중요한 지표를 나타냅니다. - Recency(최근성): 고객이 마지막으로 구매한 시점으로부터 얼마나 시간이 지났는지를 측정. 최근에 구매한 고객일수록 다시 구매할 가능성.. [Python] 유통 데이터를 활용한 리텐션과 RFM 분석(3) 앞전 포스팅에서 시간의 흐름에 따른 여러 추이에 대해 살펴보았습니다. 이번 내용에서 다룰 내용은 분석 목적 2번인 리텐션 분석입니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기 5. 리텐션(Retetion) 분석리텐션 분석은 고객 유지율을 분석하는 과정으로, 특정 기간 동안 얼마나 많은 고객이 지속적으로 제품이나 서비스를 이용하고 있는지를 측정하는 방법입니다. 본 분석에서는 특정 월에 구매한 고객이 다음 월에도 구매를 했는지에 대해 초점을 두고 분석을 진행해 보겠습니다. 데이터를 다시 살펴보겠습니다. 데이터는 한 영수증 번호에 여러 .. [Python] 유통 데이터를 활용한 리텐션과 RFM 분석(2) 이전 포스팅에서 유통 데이터에 대한 소개와 전처리를 진행했습니다. 이번 포스팅에서는 본격적인 분석에 들어가겠습니다. 분석 목적을 다시 한번 정리해 보면 다음과 같습니다. - 시간의 흐름에 따라 매출, 주문 고객수, 주문 단가의 추이는 어떻게 달라지는가?- 리텐션 분석: 시간의 흐름에 따라 고객이 얼마나 남고 이탈했는가?- RFM 분석 : 고객 행동에 따라 고객을 유형화하기 해당 페이지에서 다룰 내용은 분석 목적 1번입니다. 4. 시간의 흐름에 따른 추이 분석 ① 시간의 흐름에 따라 매출 추이는 어떻게 달라지는가? 매출 추이를 알아보기 전에 전처리가 완료된 데이터를 다시 살펴보겠습니다. InvoiceNo : 영수증 번호StockCode: 상품 번호Description: 상품명Quantity: 판매 수량.. [Python] 유통 데이터를 활용한 리텐션과 RFM 분석(1) 리텐션 분석과 RFM 분석은 고객 데이터를 이해하고 마케팅 전략을 최적화하는 데 사용하는 방법 중 하나입니다. 오늘은 유통 데이터를 활용해서 이 두 가지 분석론을 진행해 보겠습니다. 1. 데이터 소개분석에 사용한 데이터는 한 유통 회사에서 발생한 2010년 12월 1일부터 2011년 12월 9일까지 판매된 상품에 관한 데이터 입니다. import pandas as pdimport plotly.express as pxdata = pd.read_csv('ecommerce_data.csv')data.head(10) InvoiceNo : 영수증 번호StockCode: 상품 번호Description: 상품명Quantity: 판매 수량InvoiceDate: 결제 날짜UnitPrice: 개당 가격CustomerI.. [마케팅 데이터 분석] AARRR 실습(1) - Acquisition 데이터 분석을 하시는 분들이라면 AARRR에 대해 많이들 알고 계실 거라 생각합니다. 특히 DA를 희망하시는 분들이라면 채용공고에 자격 요건으로도 한 번씩 보셨을 거 같은데요. 저 또한 대략적인 개념은 알고 있지만 전체적인 내용에 대한 정리가 필요하다 판단하여 해당 글을 작성합니다. 실습 내용은 패스트캠퍼스의 직장인을 위한 파이썬 데이터분석 올인원 패키지를 참고하였습니다. 1. 데이터 설명 및 문제 정의 분석에 사용한 데이터는 캐글에 있는 미디어별 광고비와 매출 데이터입니다. (https://www.kaggle.com/datasets/sazid28/advertising.csv) TV: TV 매체비 radio: 라디오 매체비 newspaper : 신문 매체비 sales: 매출액 우선 분석을 하기전 정리해야.. 이전 1 2 3 4 다음