top of page

[데이터 시각화] 이커머스 데이터와 물류 시스템 혁신

Original Article by Youngmin Paul Cho (NYC Data Science Academy)

Translated by JJ Hwang



서론


​최근 오프라인 매장을 기반으로 한 전통적인 소매 유통업보다 빅데이터를 기반으로 한 이커머스 플랫폼의 성장세가 두드러지고 있습니다. 아마존의 성공 요인이 많이 언급되고 있기는 하지만, 데이터분석을 통해 SCM (Supply Chain Management, 공급망 관리)에 적용될 유의미한 인사이트를 도출해 내는 작업은 아직 더디게 진행되고 있습니다. 거래 데이터 (Transaction Data)에서 고객 가치 (Customer-Centric Value)를 발견하는 능력이 아직 부족한 탓인 듯 합니다.


빅데이터를 최적화하고 분석하여 유통업에 적용시키고 SCM을 혁신할 기회가 열려 있습니다. 본 포스팅은, 각광받고 있는 수요 예측 (Demand Forecasting)보다는 상대적으로 관심을 덜 받는 영역인 주문 관리 (Order Management)에 주목해 보고자 합니다.


R Shiny를 통해 분석하고 시각화하고자 하는 항목은 아래와 같으며, 이 항목들이 향후 물류 자원 배분을 최적화하는 데에 기여할 것으로 기대합니다.

· 주문이 발생한 시점부터 고객에게 최종 배송이 완료되기까지 걸리는 시간

· 주문 이월 (Back Order) 비율

· 매출 추정 지표 (Sales Run-Rate) 모니터링


데이터셋


​보안 문제로 인해 유통업이나 이커머스의 실제 세일즈 데이터를 확보하는 것은 어렵습니다만, 브라질에서 가장 큰 백화점인 Olist가 10만건 이상의 주문 데이터를 Kaggle에 공개한 덕에 본 프로젝트를 원활히 수행할 수 있었습니다.

매우 잘 정돈된 전체 데이터셋이, 전체 약 45개 특성 사이의 핵심 상관 관계라는 하나의 스타 스키마 형식에서 8개의 테이블로 구성되어 있습니다. 카테고리 특성이나 고객 리뷰가 포르투갈어로 된 것이 어려운 점이었으나 데이터셋은 대체로 분석에 용이한 형식이었습니다.

<제약 사항>

브라질 시장과 물류 체계에 대한 전문 지식의 부족이 분석을 진행하는 데 있어 가장 큰 어려움이었습니다. 이에 미국 이커머스 시장과 물류 시스템에 견주어 브라질 환경을 이해하는 것에 주력했습니다.

<접근 방식>

특성을 생성시킴으로써, 데이터셋을 ERP (Enterprise Resource Planning) 포맷에 맞게 변경하는 방식입니다. ERP 포맷은 Olist의 물류관리시스템 (Warehouse Management System)과 잘 연동될 수 있을 것입니다.


분석과 설명


​<매출>

· Olist의 2017년 한 해의 매출은 7백만 브라질 달러가 넘는다.

· 연간 성장률은 143%이다. (2017년 1주~35주 대비 2018년 1주~35주 실적)


<소요 기간>

아래는 상품 배송의 시작과 완료 사이의 간극에 대한 것이며, 본 포스팅에서 매우 중요한 부분이라고 할 수 있겠습니다.

<검은 점선 : 배송 의무일 (고객에게 공지한 예상 배송일이며 대략 24일 후)>

- 실제 배송일과 고객에게 공지한 예상 배송일이 너무 많은 차이가 나는 환경은 특히 재고가 없을 때 판매자의 주문 이행 완수의 우선순위 결정을 저해하며, 수요 예측을 어렵게 함. 예측은 주문이 발생한 시점보다는 반드시 실제 배송과 관련하여 이루어져야 함.

<녹색 그래프 : 주문과 결제 사이 (주문 후 결제가 승인되기까지 걸리는 시간)>

- 시스템이 신용카드와 현금의 유효성 검증을 하는 데 약 12시간이 소요됨.

<파란색 그래프 : 결제와 배송 사이 (판매자가 상품 배송을 시작하기까지 걸리는 시간)>

- 판매자가 배송 업체에 상품을 가져가는 데 약 3일이 소요됨.

- 많은 판매자들에게 이는 재고 부족이 아직 문제가 되지는 않음을 의미. 하지만 수요가 많아질수록 이 그래프의 길이는 길어질 것이며 예측은 더욱 부정확해 질 것임.

<빨간색 그래프 : 배송 출발과 고객 수령 사이 (배송 출발부터 고객 수령까지 데 걸리는 시간)>

- 대략 9일 소요.

- 전체 배송과정의 73%를 지연시키는 최악의 결과. 배송 업체의 서비스 개선이 필요한 지점.

- 배송 업체가 상당한 양의 배송 상품을 창고에 오랜 기간 보유하고 있음을 의미. 불필요한 비용 발생, 기회 손실, 도난 위험 등의 문제점 내포.

<주문 이월 비율>

주문 이월 비율이란 고객이 주문을 했을 때 재고 부족 등의 이유로 이를 응대하지 못한 비율을 의미합니다. 예상 배송일 이후에 배송된 상품의 빈도로 이를 측정합니다. 아래 빨간색 점선은 최소한 보유해야 하는 5% 정도의 재고를 의미합니다. 24일 내에 상품이 배송되어야 함을 알고 있음에도 불구하고, Olist의 배송 업체는 매우 저조한 품질의 서비스를 수행하고 있습니다. 전체 배송 물량의 20%가 항상 예정일 보다 늦게 배송됩니다.


주문 이월 비율 = 이월 대응으로 인해 늦게 배송된 건수 / 전체 배송된 건수 x 100

· 성수기에 주문 이월 비율이 증가하는 경향을 보임

· 주문 이월 현황이 상품의 종류보다 고객 리뷰 평점과 더 높은 연관관계가 있다는 점이 특이

· 항상 주문을 이월시키는 판매자 현황도 모니터 되고 있음


<그 외 사항들>

1. 사무용 가구는 상품 준비와 배송 기간이 매우 긴 카테고리 중의 하나입니다. 가구는 주문량이 많을 때 적절하게 대응하기가 쉽지 않기 때문입니다. 생산 기간이 매우 길기 때문에, 가구는 좀 더 향상된 판매량 예측과 적정 재고량 전략이 필요합니다.

2. Amapa, Roraima, Amazonas가 배송 기간이 평균 25일 이상인 브라질의 최상위 3개 주입니다. (2016년 9월 15일부터 2018년 8월 27일까지의 데이터 기준)

결론


​살펴본 바와 같이 아마존과 다른 이커머스 사이트와의 가장 큰 차이점은 배송의 속도입니다. 이는 고객들이 서비스 제공사를 이탈하는 하나의 큰 요인이 될 수 있습니다. 본 프로젝트의 최종적인 질문은 바로 상품의 준비기간과 배송기간을 어떻게 하면 줄일 수 있을 것인가 입니다. 이를 좀 더 상세화하면, 만약 효율적인 물류 창고나 배송 업체 선정을 위해 브라질의 한 도시를 선택해야 한다면 그 곳이 어디일까 입니다.​


군집의 중심을 찾기 위한 고객 위치의 지리 좌표를 모으기 위해 K-평균 군집화 알고리즘 (K-Means Clustering Algorithm)을 사용하였습니다. 브라질 각 분할된 지역의 중심 위치가 아마도 각 지역 물류 창고 후보지로서 가장 적합한 위치일 것입니다. 확실히 배송이행센터가 많을수록 배송의 속도도 빨라집니다. 하지만 비용효율성도 고려해야 하기 때문에, 가장 효율적인 군집의 개수를 결정하는 것이 중요합니다.

10만건의 위치 데이터만으로 최적의 군집의 개수를 결정하기는 쉽지 않습니다. 좌표의 비선명도를 개선하기 위해 elbow method를 활용하였습니다. 이는 각 군집에 대한 편차의 비율에 주목하는 것입니다. 군집 편차는 데이터 포인트들과 그들 각각의 군집 중심점 사이의 기하학적 거리의 총합으로 계산합니다. 각 군집 내의 총 편차는 이전보다 작아질 것이며, 어느 시점에서는 한계 수익이 하강할 것입니다.

아래는 각 5개의 군집에서 가장 효율적인 배송업체/물류창고의 위치를 표현하고 있습니다. 이상적인 물류창고의 크기는 12주 예상 주문율에 의거 계산하였습니다.


수집된 데이터는 분석과 시각화의 과정을 거쳐 더욱 가치가 높아집니다. 데이터 관련 프로젝트는 데이터 수집, 분석, 시각화 전문 기업 스파이더킴과 상의해 주세요!


=========================

데이터 수집/정제/분석/시각화에서 최고의 서비스를 제공합니다.

지금 바로 홈페이지를 방문하셔서, 문의 요청해 주십시오!




Opmerkingen


bottom of page