久久综合丝袜日本网手机版,日韩欧美中文字幕在线三区,亚洲精品国产品国语在线,极品在线观看视频婷婷

<small id="aebxz"><menu id="aebxz"></menu></small>

<p id="4fdxq"><kbd id="4fdxq"></kbd></p>

品才網(wǎng)>其他>以集市賣家為例對(duì)用戶進(jìn)行分層

以集市賣家為例對(duì)用戶進(jìn)行分層

時(shí)間：2022-07-10 18:48:10 其他我要投稿

相關(guān)推薦

以集市賣家為例對(duì)用戶進(jìn)行分層

本文討論的是用戶分層，有別于常規(guī)的用戶細(xì)分，最大的區(qū)別在于分層是定序的概念，即各層之間有遞進(jìn)關(guān)系；而常規(guī)細(xì)分是定類的概念，即各類之間相對(duì)獨(dú)立。廣義上而言，細(xì)分包括分層。
現(xiàn)以集市賣家分層為例，介紹整個(gè)研究方法。根據(jù)以往賣家研究的經(jīng)驗(yàn)，選取參與賣家分層的重要變量，從BI提取了100萬(wàn)集市賣家的相關(guān)數(shù)據(jù)。
重構(gòu)變量
首先對(duì)100萬(wàn)集市賣家數(shù)據(jù)進(jìn)行清洗，考察各重要變量的分布情況。由于一些定距變量存在超出正常范圍的數(shù)據(jù)，如交易數(shù)量、交易額等；一些定序變量?jī)啥私M的樣本過(guò)少，如賣家星級(jí)、店鋪類型等。這些都不利于模型的建構(gòu)，因此將每個(gè)待分析變量都細(xì)分出若干組，原則為：組盡量多，能與定距變量更相當(dāng)；每組的分布盡量保證在正常范圍內(nèi)，避免出現(xiàn)異常值。調(diào)整后的分組情況表略。其次，需要查看一下各變量的方向，后續(xù)分析的時(shí)候，根據(jù)輸出的統(tǒng)計(jì)量來(lái)觀察各變量之間是否有不同。如果方向有不同，最好能做相應(yīng)的調(diào)整。
將100萬(wàn)數(shù)據(jù)隨機(jī)拆分出三個(gè)60萬(wàn)的數(shù)據(jù)庫(kù)，四個(gè)數(shù)據(jù)分別作后續(xù)分析，以保證所得指數(shù)的穩(wěn)定性。
因子分析
首先對(duì)重要變量做因子分析，去除變量間的多重共線性，經(jīng)多次嘗試，剔除了支付寶交易量和交易額的結(jié)果更加穩(wěn)定，且更符合業(yè)務(wù)經(jīng)驗(yàn)。最終得到的KMO值為0.788，Bartlett 球形檢驗(yàn)顯著，非常適宜進(jìn)行因子分析。最終萃取出6個(gè)公因子，依次為GMV與星級(jí)、時(shí)長(zhǎng)情況、訂購(gòu)服務(wù)情況、旺鋪類型、實(shí)物商品、是否參加消保等，累積方差貢獻(xiàn)率為90.4%（詳見(jiàn)下表），解釋效果很強(qiáng)；變量原始矩陣與重構(gòu)矩陣之間的殘差>0.05的個(gè)數(shù)比例為10%，擬合效果也非常好。
經(jīng)多次驗(yàn)證整個(gè)因子分析非常穩(wěn)定，前三個(gè)因子的累積方差貢獻(xiàn)率達(dá)到60%，為主要因子；后三個(gè)因子的累積方差貢獻(xiàn)率為30%，是次要因子。這與日常業(yè)務(wù)經(jīng)驗(yàn)也非常吻合。

分層
利用六個(gè)因子得分可以算出每個(gè)樣本的因子綜合得分，其中六個(gè)因子得分軟件能夠自動(dòng)計(jì)算出來(lái)；各因子得分在因子綜合得分中所占比例，可由（每個(gè)公因子的方差貢獻(xiàn)率/累積方差貢獻(xiàn)率）算得（詳見(jiàn)下表），也可以直接使用每個(gè)公因子的方差貢獻(xiàn)率。

因?yàn)橐蜃泳C合得分為標(biāo)準(zhǔn)化值，利用（X-最小值）/（最大值-最小值），將其轉(zhuǎn)化為0-100的指數(shù)，然后按照指數(shù)高低，并結(jié)合實(shí)際現(xiàn)狀對(duì)其進(jìn)行分層，TOP1為指數(shù)最高的10%，TOP2為指數(shù)次高的20%，TOP3為指數(shù)次高的30%，剩余的是第四層，指數(shù)最低的40%。此種劃分方法比較簡(jiǎn)單，數(shù)據(jù)也較穩(wěn)定，利于實(shí)際應(yīng)用。各組上下限如下表，此種劃分的上下限可以固定下來(lái)，逐步修正。

判別分析
按照7:3的比例劃分為分析樣本和驗(yàn)證樣本，利用判別分析對(duì)這四層劃分結(jié)果進(jìn)行檢驗(yàn)，即用6個(gè)因子得分與層級(jí)做判別分析。所得判別函數(shù)對(duì)區(qū)分各層均有顯著貢獻(xiàn)，且第一個(gè)判別函數(shù)解釋的方差貢獻(xiàn)率達(dá)到98.2%，為主函數(shù)。使用組內(nèi)協(xié)方差陣計(jì)算，分析樣本和驗(yàn)證樣本的正確率、交叉核實(shí)法的正確率均為91.6%，達(dá)到很高的水平。
各層賣家在重要變量上均存在較明顯的差異，詳情如下：

從六個(gè)因子中找出解釋力較高的關(guān)鍵變量，并根據(jù)實(shí)際業(yè)務(wù)經(jīng)驗(yàn)判斷是否合適，最終選定了七個(gè)關(guān)鍵變量。它們直接與層級(jí)做判別分析，第一主判別函數(shù)的方差貢獻(xiàn)率為97.8%，使用組內(nèi)協(xié)方差陣計(jì)算，分析樣本和驗(yàn)證樣本的正確率、交叉核實(shí)法的正確率均為85.0%，也達(dá)到很高的水平。
回歸分析
為了方便應(yīng)用，簡(jiǎn)化分層的計(jì)算過(guò)程，用判別分析中確定的七個(gè)關(guān)鍵變量與因子綜合得分指數(shù)作回歸分析，以考察他們的解釋力。
回歸分析結(jié)果顯示，R、R Square、Adjusted R Square分別為0.985、0.970、0.970；剩余標(biāo)準(zhǔn)誤差為2.709，達(dá)到較小的水平；Durbin-Watson的值為1.252，與2有一定差距，殘差間的獨(dú)立性尚可，綜合判斷，模型解釋效果非常好。
多重共線性方面，賣家星級(jí)的容忍度值最小為0.39，第八個(gè)主成分的條件指數(shù)小于15，表明不存在嚴(yán)重的多重共線性。
各變量的主要指標(biāo)如下：

經(jīng)標(biāo)準(zhǔn)化偏回歸系數(shù)和偏相關(guān)系數(shù)共同分析，可知開(kāi)店時(shí)長(zhǎng)、近三個(gè)月GMV金額、賣家星級(jí)等對(duì)因子綜合得分指數(shù)的影響更重要。
因子綜合得分指數(shù)=a+b1*賣家星級(jí)分段+b2*開(kāi)店時(shí)長(zhǎng)分段+b3*近三個(gè)月GMV總金額分段+ b 4*店鋪類型+ b 5*是否主營(yíng)實(shí)物+ b 6*訂購(gòu)服務(wù)個(gè)數(shù)分段+ b 7*是否參加消保
因此，通過(guò)這七個(gè)關(guān)鍵變量預(yù)測(cè)因子綜合得分指數(shù)非常合適，得到新的因子綜合得分指數(shù)后，根據(jù)上文中的上下限臨近值，即可劃分賣家層級(jí)。
綜上所訴，研究流程歸納如下：
1、根據(jù)以往研究中對(duì)用戶的理解，確定參與分層的重要變量，提取后臺(tái)數(shù)據(jù)，對(duì)數(shù)據(jù)進(jìn)行清洗和處理；
2、采用因子分析對(duì)參與分析的重要變量進(jìn)行降維，計(jì)算出因子綜合得分；
3、將因子綜合得分轉(zhuǎn)換成指數(shù)，根據(jù)指數(shù)的分布情況，對(duì)用戶進(jìn)行分層，并用判別分析，對(duì)分層結(jié)果進(jìn)行驗(yàn)證；
4、根據(jù)因子分析中變量的解釋情況和業(yè)務(wù)實(shí)際情況，從重要變量中篩選出關(guān)鍵變量作為自變量，把因子綜合得分作為因變量，建立回歸方程，用關(guān)鍵變量推算因子綜合得分，進(jìn)行快速分層，便于后期業(yè)務(wù)應(yīng)用；
5、將后臺(tái)數(shù)據(jù)隨機(jī)拆分成不同的數(shù)據(jù)庫(kù)，分別重復(fù)以上分析過(guò)程，反復(fù)驗(yàn)證結(jié)果的穩(wěn)定性。
后續(xù)研究的思考
整個(gè)研究做下來(lái)，或許最有價(jià)值的是最終得到的回歸方程，雖然解釋力很高，但仍然缺少一些不易獲得的重要變量，如每月投入廣告的金額，包括直通車、鉆石展位等，后續(xù)的研究會(huì)逐漸把這些變量納入其中。這也表明，用戶分層研究考察的變量需要盡可能周全，這樣結(jié)果才能更具參考價(jià)值。
還有就是最后的分層結(jié)果顯得“平淡”，各層賣家在重要變量上，基本都是強(qiáng)者愈強(qiáng)、弱者愈弱，特色不明顯。這也是分層研究與細(xì)分研究的區(qū)別所在，分層更多體現(xiàn)的是趨勢(shì)性的結(jié)果。后續(xù)可以嘗試采用不等概率的抽樣方式減少一部分樣本，如發(fā)單量低的賣家占了絕大多數(shù)，可以適當(dāng)減少這部分樣本，一定程度上能夠均衡各個(gè)重要變量在分層中的作用。
不論哪種樣本結(jié)構(gòu)，都需要在實(shí)際應(yīng)用中，檢驗(yàn)效果，不斷迭代完善。

[以集市賣家為例對(duì)用戶進(jìn)行分層]相關(guān)文章：

1.以集市賣家為例對(duì)用戶進(jìn)行分層

【以集市賣家為例對(duì)用戶進(jìn)行分層】相關(guān)文章：

雙減教研小學(xué)語(yǔ)文如何進(jìn)行分層作業(yè)設(shè)計(jì)02-25

熱鬧的集市作文04-17

《集市和超市》教學(xué)設(shè)計(jì)04-05

賣家感謝信03-20

端午節(jié)集市優(yōu)秀作文11-07

用戶分析崗位職責(zé)01-15

分層教學(xué)心得體會(huì)08-29

賣家給買家的道歉信01-29

賣家道歉信01-27

淘寶賣家的道歉信03-25

最新文章

<pre id="rq2s1"><kbd id="rq2s1"><font id="rq2s1"></font></kbd></pre>