您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 > 

03 小紅書海外用戶數量統計(小紅書從用戶畫像到社區運營怎么做的)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-05-26 05:07:11【】9人已围观

简介er'])['revenue'].describe()#不同性別計數xhs['gender'].value_買粉絲unts(dropna=False).plot

er'])['revenue'].describe()#不同性別計數xhs['gender'].value_買粉絲unts(dropna=False).plot(kind='bar')#不同性別的銷售額平均值sns.barplot(x='gender',y='revenue',data=xhs)#不同性別的銷售額總和sns.barplot(x='gender',y='revenue',data=xhs,estimator=sum)女性顧客遠遠超過男性顧客數量女性顧客的銷售額平均值和男性顧客的消費額平均值相差不大總銷售額大部分由女性顧客貢獻2.2.3最近30天在APP上參與重要活動engaged_last_30

最近30天在APP上參與重要活動與否對應的銷售額是怎樣的

xhs.groupby(['engaged_last_30'])['revenue'].describe()#計數xhs['engaged_last_30'].value_買粉絲unts(dropna=False).plot(kind='bar')#最近30天在APP上參與重要活動與否對應的銷售額平均值sns.barplot(x='engaged_last_30',y='revenue',data=xhs)#最近30天在APP上參與重要活動與否對應的銷售額總和sns.barplot(x='engaged_last_30',y='revenue',data=xhs,estimator=sum)大部分用戶30天內未在APP上參加活動最近30天在APP上參與了活動的用戶的銷售額平均值更大,為320.3,未參加活動的用戶的銷售額平均值為252元。總銷售額的大部分由30天內未在APP上參加活動的用戶創造2.2.4用戶過往在第三方APP購買的數量xhs['3rd_party_stores'].describe()#用戶過往在第三方APP購買的數量計數xhs['3rd_party_stores'].value_買粉絲unts().plot(kind='bar')#用戶過往在第三方APP購買的數量對應的銷售額平均值sns.barplot(x='3rd_party_stores',y='revenue',data=xhs)#用戶過往在第三方APP購買的數量對應的銷售額總和sns.barplot(x='3rd_party_stores',y='revenue',data=xhs,estimator=sum)從未在第三方APP購買過的顧客最多,其次是在第三方APP購買過10次的顧客從未在第三方APP購買過的顧客的平均銷售額最多;在第三方APP進行了1-5次購買的顧客的平均銷售額差不多;在第三方APP進行6-10次購買的顧客的平均銷售額差不多,大于在第三方APP進行了1-5次購買的顧客的平均銷售額。總銷售額大部分由從未在第三方APP購買過的用戶貢獻,其次是在第三方APP購買過10次的用戶,再次是在第三方APP進行了1-5次購買的顧客,貢獻最少的是在第三方APP進行6-10次購買的顧客。三、相關和可視化3.1類別型變量生成啞變量xhs.info()#將gender\lifecycle\engaged_last_30\生成啞變量xhs2=pd.get_mmies(xhs)xhs2.info()3.2計算revenue和其他變量之間的相關性sns.heatmap(xhs2.買粉絲rr(),cmap='YlGnBu')lifecycle_C和days_since_last_order和3rd_party_stores兩兩正相關gender_0.0和engaged_last_30_0.0正相關revenue和其他任何變量之間的相關性都不明顯#僅查看所有變量與revenue的相關性,同時根據相關性做降序排列展示xhs2.買粉絲rr()[['revenue']].sort_values('revenue',ascending=False)revenue和其他任何變量之間的相關性都不明顯和revenue正相關性最高的是days_since_last_order、previous_order_amount、engaged_last_30_1.0和revenue負相關性最高的是3rd_party_stores、engaged_last_30_0.03.3變量可視化分析

對于revenue相關性較高的days_since_last_order、previous_order_amount、engaged_last_30_1.0、3rd_party_stores、engaged_last_30_0.0進行相關性可視化分析

#對days_since_last_order變量進行線性關系可視化分析sns.regplot('days_since_last_order','revenue',xhs2,scatter_kws={ 's':3})#對previous_order_amount變量進行線性關系可視化分析sns.regplot('previous_order_amount','revenue',xhs2,scatter_kws={ 's':3})#對engaged_last_30_1.0變量進行線性關系可視化分析sns.regplot('engaged_last_30_1.0','revenue',xhs2,scatter_kws={ 's':0.5})#對3rd_party_stores變量進行線性關系可視化分析sns.regplot('3rd_party_stores','revenue',xhs2,scatter_kws={ 's':3})

對于revenue相關性較弱的變量進行相關性可視化分析

#對age變量進行線性關系可視化分析sns.regplot('age','revenue',xhs2,scatter_kws={ 's':3})#對lifecycle_C變量進行線性關系可視化分析sns.regplot('lifecycle_C','revenue',xhs2,scatter_kws={ 's':0.01})四、回歸模型4.1模型建立#調用sklearn中的線性回歸工具包fromsklearn.linear_modelimportLinearRegression#LinearRegression()設置模型為線性回歸model=LinearRegression()#設定自變量和因變量y=xhs2['revenue']x=xhs2[['previous_order_amount','engaged_last_30_1.0','days_since_last_order']]model.fit(x,y)#查看自變量系數model.買粉絲ef_#查看截距model.intercept_4.2模型評估s買粉絲re=model.s買粉絲re(x,y)#x和y打分s買粉絲repredictions=model.predict(x)#計算y預測值error=predictions-y#計算誤差rmse=(error**2).mean()**.5#計算rmsemae=abs(error).mean()#計算maeprint(rmse)print(mae)rmse=260.5mae=205MAE(MeanAbsoluteError)絕對平均誤差,是絕對誤差的平均值把每個數據點的預測值和真實值相見,將所有數據點加總求平均可以更好地反映預測值誤差的實際情況RMSE(RootMeanSquareError)均方根誤差,將每個數據點的誤差取平方后開方RMSE比起MAE放大了誤差,對誤差的懲罰更重常用來作為機器學習模型預測結果衡量的標準#查看標準的模型輸出表fromstatsmodels.formula.apiimportolsmodel=ols('y~x',xhs2).fit()print(model.summary())R-squared僅為0.031Prob為0

該回歸基本無意義

4.3模型優化優化思路1:分組后轉換為啞變量

將days_since_last_order分組

bins1=[0,12,24]#創建分組labels1=['<12','>=12']xhs2['days_since_last_order_new']=pd.cut(xhs2['days_since_last_order'],bins1,right=False,labels=labels1)xhs2.groupby(['days_since_last_order_new'])['revenue'].describe()

days_since_last_order<12和days_since_last_order>=12的銷售額平均值存在明顯區別,分布為245和317

#僅查看所有變量與revenue的相關性,同時根據相關性做降序排列展示xhs2.買粉絲rr()[['revenue']].sort_values('revenue',ascending=False)

days_since_last_order_new_>=12和revenue相關性較高,為0.116

將days_since_last_order_new_>=12納入自變量:

#LinearRegression()設置模型為線性回歸model=LinearRegression()#設定自變量和因變量y=xhs2['revenue']x=xhs2[['previous_order_amount','engaged_last_30_1.0','days_since_last_order','days_since_last_order_new_>=12']]model.fit(x,y)s買粉絲re=model.s買粉絲re(x,y)#x和y打分s買粉絲repredictions=model.predict(x)#計算y預測值error=predictions-y#計算誤差rmse=(error**2).mean()**.5#計算rmsemae=abs(error).mean()#計算maeprint(rmse)print(mae)

添加了'days_since_last_order_new_>=12'自變量,s買粉絲re:0.030-0.031

將age分組

bins2=

很赞哦!(79438)

Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款的名片

职业:程序员,设计师

现居:江西赣州上犹县

工作室:小组

Email:[email protected]