數據分析思路
日期:2022-04-19????作者:客來網絡
在企業運營品牌之前,要有一個運營思路,做數據分析就是完善這個思路。有了完整的思路,才不至于漫無目的的做營銷推廣,后面就說網絡營銷沒效果。
我們如何才能建立一個完整的數據分析的思路呢呢?要用到幾種數據分析方法來形成完整的數據分析思路。主要分析方法有PEST分析法,5W2H分析法,邏輯樹分析法,4P營銷理論(現在用的比較多是4C),用戶行為理論。

下面就以5W2h分析方法,給大家詳細的說明一下怎么建立完整的數據分析思路。首先,先介紹一下什么是5W2H。
1、WHAT——是什么?目的是什么?做什么工作?
2、WHY——為什么要做?可不可以不做?有沒有替代方案?
3、WHO——誰?由誰來做?
4、WHEN——何時?什么時間做?什么時機最適宜?
5、WHERE——何處?在哪里做?
6、HOW ——怎么做?如何提高效率?如何實施?方法是什么?
7、HOW MUCH——多少?做到什么程度?數量如何?質量水平如何?費用產出如何?
例如要不要增加一個推廣渠道,我們來形成一個完整的分析思路。
WHAT:一個引流的渠道,對這個渠道要有一定認識。
WHY :目前其他的渠道的流量不能滿足,做了渠道之后可能會增加多少流量。
WHO:是直接讓其他渠道的人來負責,還是重新招一個操作過這個渠道的人。
WHEN:如果要做這個渠道,有沒有時間來做,什么時候開始實施。
WHERE:如果是大公司,要考慮是總公司來做,還是分公司來做。
HOW:怎么做,是否有詳細的解決方案,是否先參考同行競爭對手。
HOW MUCH:新增加的這個渠道,需要投入多少成本,人力成本,廣告成本等等。
對每個環節進行分析,評估,然后綜合每個環節,看看這個渠道是否值得開發。
例如:淘寶賣家數據顯示:
例如:淘寶賣家數據顯示:
胸最大的是新疆妹子,國內內衣消費最多的SIZE是B;其中75B銷量最好,占比41.45%,其次是A,占比 25.26%;各種顏色中,黑色最為暢銷,因為百搭。這些早已應用在內衣生產、備貨、銷售等關鍵環節。
網易云音樂數據顯示:
90后用戶占比高達59%,其次是80后(12%);除了流行歌曲,用戶最喜歡的風格竟是電音,其中又以廣東用戶對電音最為熱愛;最青睞民謠的省份是:甘肅-陜西,最喜歡舞曲的是新疆朋友;
小眾音樂主要聚集在北上廣深;這些數據也服務于網易云音樂的個性化推薦系統。
但數據分析的應用還遠不止如此,利用數據分析的方法,我們還可以得到很多有意思的結論。比如谷歌的數據分析可以預測一個地區即將爆發的流感,從而進行針對性的預防;
淘寶可以根據你瀏覽和消費的數據進行分析,為你精準推薦商品;
口碑極好的網易云音樂,通過其相似性算法,為不同的人量身定制每日歌單。數據正在變得越來越常見,而數據分析的價值也越來越凸顯。
在大型互聯網企業(比如谷歌、阿里、騰訊、等)每天將產生海量的數據;就算是初創的互聯網公司,日志、用戶、運營等數據量也不可小覷;而一大波傳統企業,在普及智能終端的情況下,所產生的數據,也非同小可。那么一個比較完善的數據分析流程是什么樣的呢?
1.問題定義
比較典型的場景是我們需要針對企業的數據進行分析。比如公司通常會有銷售數據、用戶數據、運營數據、產品生產數據……你需要從這些數據里獲得哪些有用的信息,對策略的制定進行指導呢?又比如你需要做的是一份市場調研或者行業分析,那么你需要知道你需要獲得關于這個行業的哪些信息。
首先你需要確定去分析的問題是什么?
你想得出哪些結論?
比如某地區空氣質量變化的趨勢是什么?
經常消費的是那類人?
影響公司銷售額增長的關鍵因素是什么?
生產環節中影響產能和質量的核心指標是什么?
如何對分析用戶畫像并進行精準營銷?
如何基于歷史數據預測未來某個階段用戶行為?
這些問題可能來源于你已有的經驗和知識。比如你已經知道每周的不同時間用戶購買量不一樣,那么你可以通過分析得出銷量和時間的精確關系,從而精準備貨。
有些問題則并不清晰,比如在生產環節中,影響質量的核心指標是什么,是原材料?設備水平?工人水平?天氣情況?某個環節工藝的復雜度?某項操作的重復次數?這些可能并不明顯,或者你是涉足新的領域,并沒有非常專業的知識,那么你可能需要定義的問題就需要更加寬泛,涵蓋更多的可能性。
問題的定義可能需要你去了解業務的核心知識,并從中獲得一些可以幫助你進行分析的經驗。從某種程度上說,這也是我們經常提到的數據思維。數據分析很多時候可以幫助你發現我們不容易發現的相關性,但對問題的精確定義,可以從很大程度上提升數據分析的效率。
如何更好地定義問題?
這就需要你在長期的訓練中找到對數據的感覺,開始的時候你拿到特別大的數據,有非常多的字段,可能會看不明白,到底應該從什么地方下手呢?
但如果有一些經驗就會好很多。比如,我們要分析影響一個地方房價的因素,那么我們可能會有一些通用的常識,比如城市人口、地理位置、GDP、地價、物價水平,更深入的可能會有產業格局、文化狀態、氣候情況等等,但一般我們不會去研究城市的女孩長相,美女占比。
所以當你分析的問題多了之后,你就會有一些自己對數據的敏感度,從而養成用數據分析、用數據說話的習慣。這個時候你甚至可以基于一些數據,根據自己的經驗做出初步的判斷和預測(當然是不能取代完整樣本的精準預測),這個時候,就基本擁有數據思維了。
2.數據獲取
有了具體的問題,你就需要獲取相關的數據了。如果要分析影響公司銷售的關鍵因素,就需要調用公司的歷史銷售數據、用戶畫像數據、廣告投放數據等。
數據的獲取方式有多種:
一是公司的銷售、用戶數據,可以直接從企業數據庫調取,所以你需要SQL技能去完成數據提取等的數據庫管理工作??梢愿鶕崛?017年所有的銷售數據、提取今年銷量最大的50件商品的數據、提取上海、廣東地區用戶的消費數據。SQL可以通過簡單的命令幫你完成這些工作。
第二種是獲取外部的公開數據集,一些科研機構、企業、政府會開放一些數據,你需要到特定的網站去下載這些數據。這些數據集通常比較完善、質量相對較高。當然這種方式也有一些缺陷,通常數據會發布的比較滯后,但通常因為客觀性、權威性,仍然具有很大的價值。
第三種是編寫網頁爬蟲,去收集互聯網上的數據。比如你可以通過爬蟲獲取招聘網站某一職位的招聘信息,爬取租房網站上某城市的租房信息,爬取豆瓣評分評分最高的電影列表,獲取知乎點贊排行、網易云音樂評論排行列表?;诨ヂ摼W爬取的數據,你可以對某個行業、某種人群進行分析,這算是非??孔V的市場調研、競品分析的方式了。
當然,比較BUG的一點是,你通常并不能夠獲得所有你需要的數據,這對你的分析結果是有一定影響的,但不不影響的是,你通過有限的可獲取的數據,提取更多有用的信息。
3.數據預處理
現實世界中數據大體上都是不完整,不一致的數據,無法直接進行數據分析,或分析結果差強人意。數據預處理有多種方法:數據清理,數據集成,數據變換,數據歸約等。把這些影響分析的數據處理好,才能獲得更加精確地分析結果。
比如殘缺數據,我們是直接去掉這條數據,還是用臨近的值去補全,這些都是需要考慮的問題。當然在這里我們還可能會有數據的分組、基本描述統計量的計算、基本統計圖形的繪制、數據取值的轉換、數據的正態化處理等,能夠幫助我們掌握數據的分布特征,是進一步深入分析和建模的基礎。
4.數據分析與建模。
在這個部分需要了解基本的數據分析方法、數據挖掘算法,了解不同方法適用的場景和適合的問題。分析時應切忌濫用和誤用統計分析方法。濫用和誤用統計分析方法主要是由于對方法能解決哪類問題、方法適用的前提、方法對數據的要求不清等原因造成的。
另外,選擇幾種統計分析方法對數據進行探索性的反復分析也是極為重要的。每一種統計分析方法都有自己的特點和局限,因此,一般需要選擇幾種方法反復印證分析,僅依據一種分析方法的結果就斷然下結論是不科學的。
比如你發現在一定條件下,銷量和價格是正比關系,那么可以據此建立一個線性回歸模型,發現價格和廣告是非線性關系,可以先建立一個邏輯回歸模型來進行分析。
一般情況下,回歸分析的方法可以滿足很大一部分的分析需求,當然你也可以了解一些數據挖掘的算法、特征提取的方法來優化自己的模型,獲得更好地結果。
5.數據可視化及數據報告的撰寫分析結果。最直接的結果是統計量的描述和統計量的展示。
比如影響產品質量最關鍵的幾個指標,你需要對不同指標與產品質量進行相關性分析之后才能得出正確結論。又比如你需要預測未來某個時間段的產品銷量,則需要你對歷史數據進行建模和分析,才能對未來的情況有更精準的預測。
數據分析報告不僅是分析結果的直接呈現,還是對相關情況的一個全面的認識。我們經??吹揭恍┬袠I分析報告從不同角度、深入淺析地剖析各種關系。所以你需要一個講故事的邏輯,如何從一個宏觀的問題,深入、細化到問題內部的方方面面,得出令人信服的結果,這需要從實踐中不斷訓練。
數據分析的一般流程總的來說就是這幾個步驟:問題定義、數據獲取、數據預處理、數據分析與建模、數據可視化與數據報告的撰寫。
上一篇:數據分析工具有哪些
下一篇:數據分析怎么做