數據簡介
數據分析指用适當的統計、分析方法對收集來的大量數據進行分析,将它們加以彙總和理解并消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
數據也稱為觀測值,是實驗、測量、觀察、調查等的結果。數據分析中所處理的數據分為定性數據和定量數據。隻能歸入某一類而不能用數值進行測度的數據稱為定性數據。定性數據中表現為類别,但不區分順序的,是定類數據,如性别、品牌等;定性數據中表現為類别,但區分順序的,是定序數據,如學曆、商品的質量等級等。
分析目的
數據分析的目的是把隐藏在一大批看來雜亂無章的數據中的信息集中和提煉出來,從而找出所研究對象的内在規律。在實際應用中,數據分析可幫助人們做出判斷,以便采取适當行動。數據分析是有組織有目的地收集數據、分析數據,使之成為信息的過程。這一過程是質量管理體系的支持過程。在産品的整個壽命周期,包括從市場調研到售後服務和最終處置的各個過程都需要适當運用數據分析過程,以提升有效性。例如設計人員在開始一個新的設計以前,要通過廣泛的設計調查,分析所得數據以判定設計方向,因此數據分析在工業設計中具有極其重要的地位。
類型
在統計學領域,有些人将數據分析劃分為描述性統計分析、探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重于在數據之中發現新的特征,而驗證性數據分析則側重于已有假設的證實或證僞。
探索性數據分析是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基(John Tukey)命名。
定性數據分析又稱為“定性資料分析”、“定性研究”或者“質性研究資料分析”,是指對諸如詞語、照片、觀察結果之類的非數值型數據(或者說資料)的分析。
分析方法
1、列表法
将數據按一定規律用列表方式表達出來,是記錄和處理最常用的方法。表格的設計要求對應關系清楚,簡單明了,有利于發現相關量之間的相關關系;此外還要求在标題欄中注明各個量的名稱、符号、數量級和單位等:根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。
2、作圖法
作圖法可以最醒目地表達各個物理量間的變化關系。從圖線上可以簡便求出實驗需要的某些結果,還可以把某些複雜的函數關系,通過一定的變換用圖形表示出來。
圖表和圖形的生成方式主要有兩種:手動制表和用程序自動生成,其中用程序制表是通過相應的軟件,例如SPSS、Excel、MATLAB等。将調查的數據輸入程序中,通過對這些軟件進行操作,得出最後結果,結果可以用圖表或者圖形的方式表現出來。圖形和圖表可以直接反映出調研結果,這樣大大節省了設計師的時間,幫助設計者們更好地分析和預測市場所需要的産品,為進一步的設計做鋪墊。同時這些分析形式也運用在産品銷售統計中,這樣可以直觀地給出最近的産品銷售情況,并可以及時地分析和預測未來的市場銷售情況等。所以數據分析法在工業設計中運用非常廣泛,而且是極為重要的。
分析工具
Excel作為常用的分析工具,可以實現基本的分析工作,在商業智能領域Cognos、Style Intelligence、Microstrategy、Brio、BO和Oracle以及國内産品如:大數據魔鏡、finebi、Yonghong Z-Suite BI套件等。
步驟
具體方法
數據分析有極廣泛的應用範圍。典型的數據分析可能包含以下三個步:
1、探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程拟合,計算某些特征量等手段探索規律性的可能形式,即往什麼方向和用何種方式去尋找和揭示隐含在數據中的規律性。
2、模型選定分析,在探索性分析的基礎上提出一類或幾類可能的模型,然後通過進一步的分析從中挑選一定的模型。
3、推斷分析:通常使用數理統計方法對所定模型或估計的可靠程度和精确程度作出推斷。
分析方法
1、列表法
将實驗數據按一定規律用列表方式表達出來是記錄和處理實驗數據最常用的方法。表格的設計要求對應關系清楚、簡單明了、有利于發現相關量之間的物理關系;此外還要求在标題欄中注明物理量名稱、符号、數量級和單位等;根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。最後還要求寫明表格名稱、主要測量儀器的型号、量程和準确度等級、有關環境條件參數如溫度、濕度等。
2、作圖法
作圖法可以最醒目地表達物理量間的變化關系。從圖線上還可以簡便求出實驗需要的某些結果(如直線的斜率和截距值等),讀出沒有進行觀測的對應點(内插法)或在一定條件下從圖線的延伸部分讀到測量範圍以外的對應點(外推法)。此外,還可以把某些複雜的函數關系,通過一定的變換用直線圖表示出來。例如半導體熱敏電阻的電阻與溫度關系為,取對數後得到,若用半對數坐标紙,以lgR為縱軸,以1/T為橫軸畫圖,則為一條直線。
數據來源
1、搜索引擎蜘蛛抓取數據;
2、網站IP、PV等基本數據;
3、網站的HTTP響應時間數據;
4、網站流量來源數據。
案例分析
1、沃爾瑪經典營銷案例:啤酒與尿布
“啤酒與尿布”的故事産生于20世紀90年代的美國沃爾瑪超市中,沃爾瑪的超市管理人員分析銷售數據時發現了一個令人難于理解的現象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關系的商品會經常出現在同一個購物籃中,這種獨特的銷售現象引起了管理人員的注意,經過後續調查發現,這種現象出現在年輕的父親身上。
在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相幹的商品經常會出現在同一個購物籃的現象。如果這個年輕的父親在賣場隻能買到兩件商品之一,則他很有可能會放棄購物而到另一家商店, 直到可以一次同時買到啤酒與尿布為止。沃爾瑪發現了這一獨特的現象,開始在賣場嘗試将啤酒與尿布擺放在相同的區域,讓年輕的父親可以同時找到這兩件商品,并很快地完成購物;而沃爾瑪超市也可以讓這些客戶一次購買兩件商品、而不是一件,從而獲得了很好的商品銷售收入,這就是“啤酒與尿布” 故事的由來。
當然“啤酒與尿布”的故事必須具有技術方面的支持。1993年美國學者Agrawal提出通過分析購物籃中的商品集合,從而找出商品之間關聯關系的關聯算法,并根據商品之間的關系,找出客戶的購買行為。艾格拉沃從數學及計算機算法角度提 出了商品關聯關系的計算方法——Aprior算法。沃爾瑪從上個世紀 90 年代嘗試将 Aprior 算 法引入到 POS機數據分析中,并獲得了成功,于是産生了“啤酒與尿布”的故事。
2、Suncorp-Metway使用數據分析實現智慧營銷
Suncorp-Metway是澳大利亞一家提供普通保險、銀行業、壽險和理财服務的多元化金融服務集團, 旗下擁有5個業務部門,管理着14類商品,由公司及共享服務部門提供支持,其在澳大利亞和新西蘭的運營業務與900多萬名客戶有合作關系。
該公司過去十年間的合并與收購,使客戶群增長了200%,這極大增加了客戶群數據管理的複雜性,如果解決不好,必将對公司利潤産生負面影響.為此,IBM公司為其提供了一套解決方案,組件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service與IBM Unica。
采用該方案後,Suncorp-Metway公司至少在以下三項業務方面取得顯著成效:
1、顯著增加了市場份額,但沒有增加營銷開支;
2、每年大約能夠節省1000萬美元的集成與相關成本;
3、避免向同一戶家庭重複郵寄相同信函并且消除冗餘系統,從而同時降低直接郵寄與運營成本。
由此可見,Suncorp-Metway公司通過該方案将此前多個孤立來源的數據集成起來,實現智慧營銷,對控制成本,增加利潤起到非常積極的作用。



















