- 相關(guān)推薦
數(shù)據(jù)整理分析方法
我們要使學(xué)生會進行簡單的數(shù)據(jù)整理,能把整理的數(shù)據(jù)填入統(tǒng)計表。下面小編為你整理的數(shù)據(jù)整理分析方法,希望對你有所幫助!
數(shù)據(jù)整理分析方法
1、聚類分析
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結(jié)論。不同研究者對于同一組數(shù)據(jù)進行聚類分析,所得到的聚類數(shù)未必一致。
2、因子分析
因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術(shù)。因子分析就是從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系,減少決策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對角線上的值,采用不同的共同性2估值。在社會學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。
3、相關(guān)分析
相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關(guān)關(guān)系。
4、對應(yīng)分析
對應(yīng)分析(Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,通過分析由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系?梢越沂就蛔兞康母鱾類別之間的差異,以及不同變量各個類別之間的對應(yīng)關(guān)系。對應(yīng)分析的基本思想是將一個聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點的形式在較低維的空間中表示出來。
5、回歸分析
研究一個隨機變量Y對另一個(X)或一組(X1,X2,Xk)變量的相依關(guān)系的統(tǒng)計分析方法。回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
6、方差分析
又稱“變異數(shù)分析”或“F檢驗”,是R.A.Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結(jié)果形成影響的可控因素。方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量。
實驗數(shù)據(jù)的處理自然離不開繪制成表。那么,常見的實驗數(shù)據(jù)處理表格體現(xiàn)方式分為兩種:列表法和作圖法。
列表法就是將一組實驗數(shù)據(jù)和計算的中間數(shù)據(jù)依據(jù)一定的形式和順序列成表格。列表法可以簡單明確地表示出物理量之間的對應(yīng)關(guān)系,便于分析和發(fā)現(xiàn)資料的規(guī)律性,也有助于檢查和發(fā)現(xiàn)實驗中的問題,這就是列表法的優(yōu)點。設(shè)計記錄表格時要做到:
(1)表格設(shè)計要合理,以利于記錄、檢查、運算和分析。
(2)表格中涉及的各物理量,其符號、單位及量值的數(shù)量級均要表示清楚。但不要把單位寫在數(shù)字后。
(3)表中數(shù)據(jù)要正確反映測量結(jié)果的有效數(shù)字和不確定度。列入表中的除原始數(shù)據(jù)外,計算過程中的一些中間結(jié)果和最后結(jié)果也可以列入表中。
(4)表格要加上必要的說明。實驗室所給的數(shù)據(jù)或查得的單項數(shù)據(jù)應(yīng)列在表格的上部,說明寫在表格的下部。
作圖法是在坐標紙上用圖線表示物理量之間的關(guān)系,揭示物理量之間的聯(lián)系。作圖法既有簡明、形象、直觀、便于比較研究實驗結(jié)果等優(yōu)點,它是一種最常用的數(shù)據(jù)處理方法。作圖法的基本規(guī)則是:
(1)根據(jù)函數(shù)關(guān)系選擇適當?shù)淖鴺思?如直角坐標紙,單對數(shù)坐標紙,雙對數(shù)坐標紙,極坐標紙等)和比例,畫出坐標軸,標明物理量符號、單位和刻度值,并寫明測試條件。
(2)坐標的原點不一定是變量的零點,可根據(jù)測試范圍加以選擇。坐標分格最好使最低數(shù)字的一個單位可靠數(shù)與坐標最小分度相當。縱橫坐標比例要恰當,以使圖線居中。
(3)描點和連線。根據(jù)測量數(shù)據(jù),用直尺和筆尖使其函數(shù)對應(yīng)的實驗點準確地落在相應(yīng)的位置。一張圖紙上畫上幾條實驗曲線時,每條圖線應(yīng)用不同的標記如“+”、“×”、“·”、“Δ”等符號標出,以免混淆。連線時,要顧及到數(shù)據(jù)點,使曲線呈光滑曲線(含直線),并使數(shù)據(jù)點均勻分布在曲線(直線)的兩側(cè),且盡量貼近曲線。個別偏離過大的點要重新審核,屬過失誤差的應(yīng)剔去。
(4)標明圖名,即做好實驗圖線后,應(yīng)在圖紙下方或空白的明顯位置處,寫上圖的名稱、作者和作圖日期,有時還要附上簡單的說明,如實驗條件等,使讀者一目了然。作圖時,一般將縱軸代表的物理量寫在前面,橫軸代表的物理量寫在后面,中間用“~”聯(lián)接。
六大數(shù)據(jù)分析的常見方法
1、對比分析法
對比分析法是一種常見的數(shù)據(jù)分析方法。通過數(shù)據(jù)分析比對,能告訴你過去發(fā)生了什么(現(xiàn)狀分析)、告訴你某一現(xiàn)狀為什么發(fā)生(原因分析)、告訴你將來會發(fā)生什么(預(yù)測分析)。
對比分析法是指將兩個或兩個以上的數(shù)據(jù)進行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律性。對比分析法的特點是:可以非常直觀地看出事物某方面的變化或差距,并且可以準確、量化地表示出這種變化或差距是多少?
對比分析法可分為靜態(tài)比較和動態(tài)比較兩類。靜態(tài)比較是在同一時間條件下對不同總體指標的比較,如不同部門、不同地區(qū)、不同國家的比較、也叫橫向比較,簡稱橫比;動態(tài)比較是在同一總體條件下對不同時期指標數(shù)值的比較,也叫縱向比較,簡稱縱比。
這兩種方法既課單獨使用,也可結(jié)合使用。進行對比分析時,可以單獨使用總量指標、相對指標或平均指標,也可將它們結(jié)合起來進行對比。比較的結(jié)果可用相對數(shù)表示,如百分數(shù)、倍數(shù)等指標。
注意事項:
指標的口徑范圍、計算方法、計量單位必須一致,即要用同一種單位或標準去衡量;對比的對象要有可比性;對比的指標類型必須一致。無論絕對數(shù)指標、相對數(shù)指標、平均數(shù)指標,還是其他不同類型的指標,在進行對比時,雙方必須統(tǒng)一。
2、關(guān)聯(lián)分析法
關(guān)聯(lián)分析法是一種十分實用的分析技術(shù),是從大量數(shù)據(jù)中發(fā)現(xiàn)項集之間有趣的關(guān)聯(lián)和相關(guān)關(guān)系,從而描述一個事務(wù)中某些屬性同時出現(xiàn)的規(guī)律和模式。
關(guān)聯(lián)分析的一個典型例子是購物籃分析,這是一個很有趣的典型案例:美國學(xué)者Agrawal在發(fā)現(xiàn)啤酒和紙尿褲經(jīng)常一起出現(xiàn)在顧客購物籃中后,進行了研究,發(fā)現(xiàn)原因出自“奶爸”這一群體。首先,從時間上,周末比工作日購買紙尿褲喝啤酒的頻率更多;其次,爸爸們喜歡看體育節(jié)目,而且更愛邊喝啤酒邊看,且美國的體育節(jié)目多在周末扎堆。所以,當周末母親需要給孩子換紙尿褲時,通常會讓正在看球的奶爸去買。奶爸出去買紙尿褲,會順便帶些啤酒回來。
世間萬物之間多多少少會有一些關(guān)聯(lián),通過關(guān)聯(lián)分析法,我們可以通過數(shù)據(jù)挖掘,將這些關(guān)聯(lián)規(guī)則挖掘出來。
3、漏斗分析法
漏斗分析法是一個適合業(yè)務(wù)流程比較規(guī)范、周期比較長、各流程環(huán)節(jié)涉及復(fù)雜業(yè)務(wù)過程比較多的管理分析工具。例如漏斗圖用于網(wǎng)站中某些關(guān)鍵路徑的轉(zhuǎn)化率的分析,不僅能顯示用戶從進入網(wǎng)站到實現(xiàn)購買的最終轉(zhuǎn)化率,同時還可以展示整個關(guān)鍵路徑中每一步的轉(zhuǎn)化率。
單一的漏斗圖無法評價網(wǎng)站某個關(guān)鍵流程中個步驟轉(zhuǎn)化率的好壞。我們可以利用之前介紹的對比分析法,對同一環(huán)節(jié)優(yōu)化前后的效果進行對比分析,或?qū)ν画h(huán)節(jié)不同細分用戶群的轉(zhuǎn)化率作比較,或?qū)ν袠I(yè)類似產(chǎn)品的轉(zhuǎn)化率進行對比,等等。
4、帕累托分析
帕累托分析又稱ABC分類庫存控制法,平常也稱之為二八定律。二八定律是20世紀初意大利統(tǒng)計學(xué)家、經(jīng)濟學(xué)家維爾弗雷多·帕累托提出的:在任何特定群體中,重要的因子通常只占少數(shù),約20%,而不重要的因子則占多數(shù),約80%,因此只要能控制具有重要性的少數(shù)因子即能控制全局。二八定律與 ABC 分類法大致相同,都是少數(shù)項目貢獻了大部分價值。不同之處是ABC 分類法將對象分三類,而二八分析則為 A、B 兩類,A 類品牌商品占總體的一小部分,貢獻了 80%的銷售額。
ABC分類的核心思想:少數(shù)項目貢獻了大部分價值。以款式和銷售量為例:A 款式數(shù)量占總體 10% ,卻貢獻了 80% 的銷售額。
按照ABC分組對產(chǎn)品進行分類,根據(jù)產(chǎn)品的效益將其分為三個等級,這樣就可以有針對性地投放不同程度的資源,以達成產(chǎn)出最優(yōu)效益的目的。
5、留存分析法
留存分析是一種用來分析用戶參與情況的分析模型,可以用來衡量產(chǎn)品對用戶價值的高低。留存分析應(yīng)該能夠靈活配置,通過留存率能夠判斷產(chǎn)品每一個步驟對客戶的粘性,通過留存分析,能夠宏觀把控用戶生命周期內(nèi)產(chǎn)品的改善點。留存不僅是個可以反映客戶粘性的指標,更多地反映產(chǎn)品對用戶的吸引力。
按照不同周期,留存率分為三類:
日留存:
第一種是日留存,日留存又可以細分為以下幾種:
次日留存率:(當天新增的用戶中,第2天還登錄的用戶數(shù))/第一天新增總用戶數(shù);
第3日留存率:(第一天新增用戶中,第3天還有登錄的用戶數(shù))/第一天新增總用戶數(shù);
第7日留存率:(第一天新增用戶中,第7天還有登錄的用戶數(shù))/第一天新增總用戶數(shù);
第14日留存率:(第一天新增用戶中,第14天還有登錄的用戶數(shù))/第一天新增總用戶數(shù);
第30日留存率:(第一天新增用戶中,第30天還有登錄的用戶數(shù))/第一天新增總用戶數(shù)。
周留存:
第二種是周留存,以周度為單位的留存率,指的是每個周相對于第一個周的新增用戶中,仍然還有登錄的用戶數(shù)。
月留存:
第三種是月留存,以月度為單位的留存率,指的是每個月相對于第一個周的新增用戶中,仍然還有登錄的用戶數(shù)。
6、客戶畫像分析法
客戶畫像分析是衡量客戶價值和客戶創(chuàng)造利益能力的重要工具和手段,通過將典型客戶信息標簽化,來更好地對其開展營銷活動。
RFM模型通過R(Rencency)近度、F(Frequency)頻度、M(Monetary)額度三個指標將客戶劃分為8個類別。
通過RFM,我們可以把客戶分為8類,然后就能方便公司針對不同的特征的用戶產(chǎn)出相應(yīng)的營銷策略。
【數(shù)據(jù)整理分析方法】相關(guān)文章:
銷售數(shù)據(jù)的分析方法07-25
數(shù)據(jù)分析與辦公軟件:數(shù)據(jù)分析方法07-10
配件庫存分析數(shù)據(jù)的方法07-10
多維數(shù)據(jù)分析方法04-07
銷售數(shù)據(jù)分析的方法07-03
銷售數(shù)據(jù)分析方法07-03
數(shù)據(jù)分析常用方法07-26
數(shù)據(jù)分析技巧和方法07-10