- 相關推薦
數(shù)據(jù)分析六部曲
明確分析的內(nèi)容和目的、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)、報告撰寫等6個步驟。
明確數(shù)據(jù)分析的目的和內(nèi)容是確保數(shù)據(jù)分析過程有效的進行的先決條件,以便明確數(shù)據(jù)分析方向,保證不迷失方向。
數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析內(nèi)容,收集相關數(shù)據(jù)的過程,它為數(shù)據(jù)分析提供了素材和依據(jù)。這里所說的數(shù)據(jù)包括第一手數(shù)據(jù)與第二手數(shù)據(jù),第一手數(shù)據(jù)是指可以直接獲取的數(shù)據(jù),第二手數(shù)據(jù)是指經(jīng)過加工整理后得到的數(shù)據(jù)。一般數(shù)據(jù)來源主要有數(shù)據(jù)庫、互聯(lián)網(wǎng)、公開出版物、市場調(diào)查等形式。
數(shù)據(jù)處理:
是指對收集過來的數(shù)據(jù)進行加工處理,形成適合分析的樣式,它是數(shù)據(jù)分析必不可少的步驟。數(shù)據(jù)處理基本是從大量的、雜亂無章、難以理解的數(shù)據(jù)中推導出對解決問題有價值、有意義的數(shù)據(jù)。(數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取、數(shù)據(jù)計算等方法。)
數(shù)據(jù)分析:
主要是指通過統(tǒng)計分析或者數(shù)據(jù)挖掘技術對處理過的數(shù)據(jù)分析,從中發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部關系和規(guī)律,為解決問題提供參考。
數(shù)據(jù)分析與數(shù)據(jù)處理的區(qū)別:數(shù)據(jù)處理是數(shù)據(jù)分析的基礎。通過數(shù)據(jù)處理,將收集到的原始數(shù)據(jù)轉(zhuǎn)換為可以分析的數(shù)據(jù)形式,并保證數(shù)據(jù)的一致性和有效性。如果數(shù)據(jù)本身存在問題,那么即使采用最新進的數(shù)據(jù)分析方法,得到的結(jié)果也是錯誤的。
數(shù)據(jù)分析與數(shù)據(jù)挖掘的關系:數(shù)據(jù)挖掘就是一種高級的書分析方法,數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,它是根據(jù)用戶的特定要求,從浩瀚如煙的數(shù)據(jù)中找出所需要的數(shù)據(jù),以滿足用戶的需求。數(shù)據(jù)挖掘主要側(cè)重于解決四類數(shù)據(jù)分析問題:分類、聚集、關聯(lián)、預測。
數(shù)據(jù)展現(xiàn):
數(shù)據(jù)是通過表格和圖形的方式呈現(xiàn)出來的,我們常說用圖標說話就是這個意思。常用的數(shù)據(jù)圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等。也可以對這些圖進行加工,展現(xiàn)出來我們所需要的圖。一般情況下用圖說明問題的就不用表格,用表格說明問題的就不文字。
報告撰寫:
數(shù)據(jù)分析報告其實就是對整個數(shù)據(jù)分析過程的一個總結(jié)與呈現(xiàn)。通過報告,把數(shù)據(jù)分析的起因,過程,結(jié)果及建議完整的呈現(xiàn)出來,以供決策者參考。數(shù)據(jù)分析報告一定要有建議和解決方案,作為決策者,需要的不僅僅是找出問題,最重要的是建議和解決方案,以便他們在決策時候做參考。所以數(shù)據(jù)分析師不僅僅需要掌握數(shù)據(jù)分析的方法,而且還需要了解和熟悉業(yè)務,這樣才能根據(jù)發(fā)現(xiàn)的業(yè)務問題,提出具有可行性的建議和解決方案。
數(shù)據(jù)分析常用的指標和術語:
平均數(shù):一般指的是算數(shù)平均數(shù)。算數(shù)平均數(shù)是非常重要的基礎性指標。平均數(shù)是綜合指標,它的特點是將總體內(nèi)各單位的數(shù)量差異抽象化,代表總體的一邊水平,掩蓋總體內(nèi)各單位的差異。
絕對數(shù)與相對數(shù)
絕對數(shù)是反映客觀現(xiàn)象總體在一定時間、地點條件下的總規(guī)模、總水平的綜合性指標。也就是數(shù)據(jù)分析中的常用指標,如:GDP,總?cè)丝诘取?/p>
相對數(shù)是指由倆個有聯(lián)系的指標對比計算而得到的數(shù)值,它是反映客觀現(xiàn)象之間數(shù)量連續(xù)程度的綜合指標。計算相對數(shù)的基本公式:相對數(shù)=比較數(shù)值(比數(shù))/基礎數(shù)值(基數(shù))
說明:分母就是用作對比標準的指數(shù)數(shù)值,簡稱基數(shù)。分鐘是用做與基數(shù)對比的指數(shù)數(shù)值,簡稱比數(shù)。相對數(shù)一般以倍數(shù)、成數(shù)、百分數(shù)等表示,它反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。
百分比與百分點:百分比是相對數(shù)的一種,它表示一個數(shù)是另一個數(shù)的百分之幾,也稱百分率或者百分數(shù)。百分比通常采用百分號來表示。由于百分比的分母都是100,也就是以1%作為度量單位,由于比較便捷,被廣泛應用。百分點是指不同的時期以百分數(shù)的形式表示的相對指標的變動幅度。
頻數(shù)與頻率:頻數(shù)是指一組數(shù)據(jù)中個別數(shù)據(jù)重復出現(xiàn)的次數(shù)。頻率是指每組類別次數(shù)與總次數(shù)的比值,它代表某類別在總體中出現(xiàn)的頻繁程度,一邊用百分數(shù)表示。
比例與比率:比例是指在總體中各部分的數(shù)值占全部數(shù)值的比重,通常反映總體的構(gòu)成和結(jié)構(gòu)。比率是指不用類別數(shù)值的對比,它反映的不是部分與整體之間的關系,而是一個整體各部分之間的關系。
倍數(shù)與番數(shù):倍數(shù)與番數(shù)同樣屬于相對數(shù)。倍數(shù)是一個數(shù)吃了另一個數(shù)所得的商,倍數(shù)一般是表示數(shù)量增長或上升幅度而不適用于表示數(shù)量的減少或者下降。番數(shù)是指原來數(shù)量的2的N次方倍。
同比和環(huán)比:同比是指與歷史同期進行比較得到的值,該指標主要是反映的是事物發(fā)展的相對情況。環(huán)比是指與前一個統(tǒng)計期進行比較得到的值,該指標主要是反映的是事物逐漸發(fā)展的情況。
[數(shù)據(jù)分析六部曲]相關文章:
【數(shù)據(jù)分析六部曲】相關文章:
數(shù)據(jù)分析三部曲07-10
游戲數(shù)據(jù)分析三步曲07-10
數(shù)據(jù)分析與辦公軟件:數(shù)據(jù)分析方法07-10
數(shù)據(jù)分析07-10
電子商務企業(yè)數(shù)據(jù)分析三部曲07-10