Storytelling with Data – Phần 2: Thấu hiểu hành vi

Công viên quốc gia Yosemite, Californnia - Ảnh: Unsplash

Trong bài viết trước, mình đã giới thiệu về cuộc thi Storytelling with Data, bộ dữ liệu US eCommerce và nội dung câu chuyện sẽ kể theo trình tự:

Bạn có thể xem lại phần 1: Xác định nội dung

Trong bài viết này, mình sẽ trình bày về diễn biến câu chuyện trong hành trình tìm kiếm insight của các đối tượng khách hàng qua các minh họa trên QuickSight. Bên cạnh đó, do không còn lưu lại QuickSight Dashboard, mình cũng sử Tableau cho bài viết thêm trực quan.

Bạn cũng có thể ghé thăm bài dự thi của mình

Xác định điểm nổi bật

Thông qua việc tìm kiếm và kết nối các điểm nhấn, mình hy vọng sẽ thấy được bức tranh tổng quát của US eCommerce

Doanh số bán hàng ngày

Doanh số bán hàng theo ngày từ 13/09/2013 – 14/01/2014

Dựa vào biểu đồ đường, ta thấy doanh thu hàng ngày của các trang thương mại điện tử có xu hướng gia tăng vào dịp cuối năm và đạt đỉnh vào các ngày Black Friday, Cyber Monday Green Monday.

Tuy nhiên, sau ngày 13/12/2013, doanh số bán hàng đột ngột tuột dốc không phanh đến 70%.

Doanh số đột ngột giảm 70%

Nguyên do nào dẫn đến hiện tượng này?

Điểm khác thường trong dữ liệu

  • Dữ liệu bán hàng của bang Washington (bang có doanh số cao nhất) sau ngày 13/12/2013 đã bị thiếu.
  • Bên cạnh đó, số liệu bán hàng của bang California cũng đột ngột tăng mạnh kể từ ngày 14/10/2013.
  • Cùng với đó, doanh số của bang Ney York cũng đột ngột tăng mạnh sau ngày 24/10/2013.

Trong trường hợp này, để đảm bao sự công bằng trong các so sánh, việc loại bỏ dữ liệu trước ngày 24/10 và sau ngày 13/12/2013 là việc cầm làm. Tuy nhiên, dữ liệu lúc này chỉ còn 50 ngày, so với 115 ngày như dữ liệu gốc.

Tỉ lệ doanh thu/ngày của 2 phương án trên có mức chênh lệch không lớn. Do đó, mình vẫn dữ nguyên dữ liệu gốc.

Như vậy, chúng ta đã tạm thời xác định được các điểm nổi bật:

  • Xu hướng tăng trong doanh số trong những tháng cuối năm
  • Doanh số đạt đỉnh vào các dịp khuyến mãi lớn: Black Friday, Cyber Monday và Green Moday
  • Dữ liệu bán hàng tại bang tại bang Washington sau ngày 13/12/2013 bị thiếu

Tiếp theo, ta sẽ tìm hiểu kỹ hơn về đối tượng khách hàng

Đối tượng khách hàng

Việc phân loại khách hàng theo vị trí địa lý và giới giúp việc thấu hiểu nhu cầu của các nhóm từ đó giúp việc phân phối các nguồn lực trở nên hiệu quả hơn.

Theo vị trí địa lý

Tất cả các đơn hàng trong bộ dữ liệu đến từ 3 thành phố New York (NY), Los Angeles (CA) và Seattle (WA).

Trong đó, Seattle và Los Angeles chiếm 96% số lượng đơn hàng.

Theo giới tính

Trên bình diện cả nước, số lượng khách hàng nam giới nhiều hơn 32%

Tuy nhiên, khi quan sát từng địa phương, đa phần khách hàng tại New York là Nam giới, trong khi tại Los Angeles tỉ lệ khách hàng Nam/Nữ tương đối cân bằng.

Điểm nhấn chính

  • Có sự chênh lệch lớn về số lượng khách hàng, doanh số bán tại 3 thành phố: Seattle > Los Angels > New York
  • Số lượng khách hàng nam giới > 30% nửa còn lại
  • Tuy nhiên, tỷ lệ khách hàng Nam/Nữ của 3 thành phố cũng có sự khác biệt: New York > Seattle > Los Angeles

Dựa vào thông tin về vị trí địa lý và giới tính phía này, mình đi sâu tìm hiểu về hành vi theo từng nhóm.

Xác định hành vi của khách hàng

Thiết bị mua hàng

Khi quan sát nền tảng mua hàng, mình thấy một thông tin tương đối bất ngờ.

Tại thời điểm khảo sát vào năm 2013-2014, 80% khách hàng vẫn sử dụng trình duyệt web là công cụ mua hàng chính. Tuy nhiên, điều khiến mình bất ngờ là mặc dù chiếm tỉ trọng thấp hơn nhưng nhóm khách hàng Nữ giới lại dẫn đầu xu hướng khi sử dụng thiết bị di động nhiều hơn.

Khi so sánh tỉ lệ này giữa các thành phố, dựa vào tỉ lệ giới tính ở trên, có một số điểm nổi bật:

  • Tỉ lệ theo giới tính tại Los Angeles rất đồng đều
  • Ney York và Seattle chứng kiến sự phân cực lớn
  • Khách hàng nữ tại Seattle yêu thích sử dụng ứng dụng di đông hơn 78%

Danh mục hàng hóa

Các sản phẩm trong danh mục hàng hóa có một số đặc điểm

  • Mặt hàng có doanh thu thấp: Hair Band, Pen Drive, Vessels và Cycle
  • Khách hàng nữ giới yêu thích: Jeans, Fairness Creams và Shoes
  • Khách hàng nam giới thường lựa chọn: Shirts, spectacles và Books

Doanh số bán theo ngày

Quan sát doanh số bán ra theo ngày của 2 giới, ta thấy dường như chúng không tương quan với nhau.

Khách hàng nữ giới có xu hướng mua chi tiêu ít hơn vào dịp cuối năm.

Nhưng khi khảo sát theo từng thành phố, có một điều lạ lùng xuất hiện

Tại Seattle, chi tiêu của 2 giới sau ngày 14/10 đột ngột đi ngược chiều nhau. Trong khi đó, tại New York và Los Angeles, chi tiêu của 2 giới vẫn tương quan với nhau.

Dịch vu giao hàng

Quan sát dịch vụ giao hàng theo từng bang, có một điểm thú vị khác:

  • Trong khi khách hàng tại New York và Los Angeles yêu thích việc sử dụng dịch vụ giao hàng 1
  • Khách hàng tại Seattle lại thường sử dụng dịch vụ giao hàng thông thường
  • Bên cạnh đó, không có sự khác biệt trong việc lựa chọn hình thích giao hàng giữa các giới

Khi quan sát theo danh mục hàng hóa

Khách hàng có xu hướng lựa chọn dịch vụ giao hàng 1 ngày khi mua các mặt hàng Electronics và Sationaries.

Kết luận

Từ những quan sát và minh họa trên bộ dữ liệu US E-Commerce, mình tổng hợp lại một số điểm nhấn chính:

  1. Doanh số bản lẻ vào quý 4 tăng nhanh, đặc biệt đạt đỉnh vào những ngày có khuyến mãi lớn: Black Friday, Cyber Monday và Green Moday.
  2. Khách hàng phân bố không đồng đều tại 3 thành phố: Seattle (65.5%), Los Angeles (31.1%) và New York (4.4%).
  3. Số lượng khách hàng Nam giới > 30 nửa còn lại. Cũng tại 3 thành phố, Los Angeles có tỉ lệ khách hàng Nam/Nữ cân bằng trong khi 75% khách hàng ở New York là nam.
  4. Khách hàng Nam giới yêu thích sử dụng nền tảng Website khi mua hàng, họ có xu hướng mua Áo và sách. Nhóm khách hàng Nữ giới yêu thích sử dụng ứng dụng di động và thường mua Jeans, Kem dưỡng da và giày.
  5. Nhóm khách hàng tại Los Angeles và New York thường sử dụng dịch vụ giao hàng 1 ngày, trong khi đó khách hàng tại Seattle thường sử dụng dịch vụ giao hàng bình thường.

Bênh cạnh đó là một số nhận xét về bộ dữ liệu US E-Commerce:

  • Dữ liệu tại các thành phố sau bị thiếu:
    • Seattle: Sau ngày 13/12/2013
    • New York: Trước ngày 10/10/2013
  • Dữ liệu thiếu tin cậy:
    • Los Angeles: Dữ liệu trước ngày 14/10/2013 kém tin cậy
    • Ney York: Dữ liệu trước ngày 24/10/2013 kém tin cậy
    • Dữ liệu doanh số bán hàng của khách hàng Nữ sau ngày 14/10/2013 đột ngột tụt dốc

Phew, cuối cùng cũng xong rồi.

frodo it's over it's done - Frodo it's over it's done | Make a Meme

Quả thật là tham gia Workshop, cuộc thi Storytelling with Data của AWS Vietnam giúp mình học hỏi được rất nhiều thứ thú vị. Các bạn có thể tham khảo các bài dự thi khác tại đây. Nếu có dịp, mình sẽ tham khảo lại các bài thi này để vừa học hỏi, vừa thuyết minh lại cho các bạn nha.

Cảm ơn bạn ghé thăm.

Happy Reading ༼つ ் ▽ ் ༽つ

Leave a comment

Your email address will not be published.