對某一淘寶商品購買信息進行數據分析,在進行數據清洗后,進入分析階段,回答以下問題。
1.明確問題:
用戶和購買量——篩選出店鋪的忠實顧客?
本來是想通過多表關聯查詢,了解忠實顧客達到嬰兒具體信息,可以針對性的推出產品,但是表2 嬰兒信息的用戶數量遠少于表1 ,大多用戶在表2中查詢不到,實際操作中這個思路可以嘗試。
購買時間和購買量有何關聯——了解客戶的購買習慣?
商家在14年的銷售量最佳,2012年和2015年都不是完整的月份。
在數據段中,2013年和2014年具有完整的銷售月份數據,商品銷售量整體是上升的趨勢,出現了兩個峰值,分別在5月份和11月份,可能是顧客的需求增大或者商家的促銷活動力度較大和產品推廣明顯,較其他月份,2月屬于淡季。
嬰兒出生日期和購買量之間的關系——了解產品面對的客戶群體特征?
可以看出,2011年后出生的嬰兒銷售量占主要部分,前面交代了2015年的數據只有前面幾個月,所以在此條分析中可以不考慮2015年的數據,在2011-2014年的銷售量中,男嬰的銷售量均大于女嬰的銷售量。
嬰兒性別和購買量之間的關系——了解產品面對的客戶群體特征?
在現有數據中發現,男嬰的銷售量大于女嬰的銷售量
2. 理解數據:列名含義
表一購買商品包含的列名有:
User_id表示用戶的賬號,具有唯一性
Auction_id表示物品編號
Cat_id表示商品種類
Cat1表示商品屬于哪個類別
Property表示商品屬性
Buy_mount表示用戶購買這件物品的數量
Day表示用戶購買該物品的時間
表二嬰兒信息包含的列名有:
User_id表示用戶的賬號,具有唯一性
Birthday表示嬰兒的出生日期
Gender表示嬰兒的性別:“1”代表女生,“0”代表男生
3.數據清洗:
選擇子集:可隱藏不需要用到的列信息
列名重命名
刪除重復值:數據選項下刪除重復項
缺失值處理:統計缺失值:定位到空值,輸入內容時可按Ctrl+Enter,其他空白單元格也會填充相同內容
一致化處理
數據排序
異常值處理
日期數字處理
4. 數據分析:
分組匯總 【數據透視表】
統計描述分析 【分析工具庫】
多表關聯查詢
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: 淘寶電商數據分析