본문 바로가기

데이터 분석/프로젝트

위드(with)코로나 시대 소비 변화 - 번외

반응형

데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다.

앞의 포스팅에 번외적인 내용까지 한번에 담기엔 너무 길어 나눠서 작성합니다!

이전 내용은 아래 링크로 이동하시면 됩니다.

 

https://data-gongbu.tistory.com/9

 

위드(with)코로나 시대 소비 변화

데이콘에서 진행한 포스트 코로나 데이터 시각화 경진대회에 참여했던 내용입니다. 코로나가 확삼됨에 따라 소비 패턴이 변화하는 것을 월별 매출의 증감을 통해 파악해보자는 취지에 의해 분

data-gongbu.tistory.com


 

택시의 매출건수로 보는 코로나19

회현동에서는 월요일마다 도대체 무슨일이?


'관광' 카테고리에서 매출 건수를 자세히 들여다보니, 매출 건수가 유독 많은 업종이 있었습니다.

특히, 특정 지역에서 주기적으로 같은 현상이 발생하는 흥미로운 점을 발견했습니다.

이 부분은 재미로 봐주시면 될 것 같습니다 :)

 

travel <- card2 %>% filter(category_l == "관광")
#summary(travel$salary_count)
# 위의 코드를 실행한 결과입니다.
display_png(file="summary.png")

위의 내용은 EDA 과정에서, '관광' 카테고리의 데이터 요약을 뽑아본 결과입니다.
salary_count(매출건수)의 평균과 최댓값이 매우 큰 차이를 보여서 그 부분을 자세히 살펴보았습니다.

따라서 매출 건수가 80만건 이상인 경우를 추출해보았습니다.

 

travel %>%
  filter(salary_count > 800000)

이와 같이, 매출 건수가 80만건 이상인 경우는 모두 택시 업종인 것을 확인할 수 있었습니다.
그리고 날짜도 일주일 간격인 것이 보이시나요?ㅎㅎ 이 부분이 재미있었고, 이를 좀 더 시각화하여 나타내고자 하였습니다.

 

taxi <- card %>%
  filter(category_m == "택   시") %>%
  group_by(date) %>%
  summarise(salary_count = sum(salary_count)) %>%
  ungroup()
taxi_calendar <- data.table(date = seq(ymd("2020-01-01"), ymd("2020-06-14"), by = "1 day"))
taxi <- taxi %>%
  right_join(taxi_calendar, by = "date") %>%
  mutate_at(vars(salary_count), replace_na, 0)
taxi <- taxi %>%
  mutate(month = month(date, label = TRUE),
         wday = wday(taxi$date, label = TRUE,  week_start = 7),
         week = epiweek(date))
taxi <- taxi %>%
  group_by(month) %>%
  mutate(month_week = 1 + week - min(week))

options(repr.plot.width=12, repr.plot.height=8)
ggplot(taxi, aes(x = wday, y = -month_week, fill = salary_count)) +
  geom_tile(colour = "white") +
  geom_text(aes(label = day(date)), size = 3) +
  theme(axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        axis.text.y = element_blank(),
        panel.grid = element_blank(),
        axis.ticks = element_blank(),
        panel.background = element_blank(),
        strip.background = element_blank(),
        strip.text = element_text(face = "bold", size = 15),
        panel.border = element_rect(colour = "black", fill=NA, size=1)) +
  scale_fill_gradient(low = "#FAFAFA", high = "#E65100") +
  facet_wrap(~month, nrow = 2, ncol = 3, scales = "free") +
  labs(title = "1월 ~ 6월의 일별 택시 매출건수", fill = "매출건수")+
  theme(plot.title = element_text(size = 20))

'택시'의 경우 1,2,3,4,5,6월 모두 '회현동'에서 가장 많은 탑승이 일어나는 것으로 데이터에서 확인 했습니다.
회현동은 서울역 근처이고 회사가 많은 지역인데요, 달력에서 보이는것과 같이 매주 '월요일'마다 택시 이용 빈도가 높아 지는것을 확인 할 수 있습니다.

하지만 1,2월과 비교해 봤을때 3,4월부터 월요일에 탑승 빈도가 많이 줄어든 것을 확인 할 수 있었는데,
코로나의 영향으로 '재택근무'가 많아졌기 때문으로 추정 됩니다.

그리고 5월부터는 또 다시 매출이 증가하는 것을 확인할 수 있었습니다. 저희는 이를 코로나 정책으로 '사회적 거리두기'가 아닌 '생활속 거리두기'로 바뀐 것이 이유라고 추측해보았습니다.

그런데, 실제 '생활속 거리두기'가 시행된 것은 5월 6일부터였는데 5월 4일에 나타난 많은 매출건수는 황금연휴를 이용하여 많은 사람들이 서울역을 이용한 때문이지 않을까요?ㅎㅎ

 

 

 

 

 

반응형