以下,是我聽演講,上網搜尋找到的相關資料,分享給大家

然後我很懶得去抓圖片來這邊貼,所以沒有圖片

本來想說要不要錄成影片,但是太麻煩了,而且也不知道有沒有人看

如果有錯誤的地方,再請各位厲害的大大指教,謝謝

===================================================

 

今天要來分享的是,大數據分析的步驟,其實也是觀念,我並沒有什麼實際操作的例子

直接切入正題吧!

 

當你想要進行大數據分析的第一步驟當然就是收集數據,廢話

這也是為什麼我沒有實際操作的例子給大家參考的原因,我連第一步驟都沒達成

所以,請你想一下,如果你有意願來操作大數據分析

那麼,你得先找好一個數據庫,不管是公司的數據或是Open source的數據庫

反正你就一定要有數據嘛,不然要怎麼進行下去呢?

如何得到這些數據?那就是你該煩惱的問題

 

第二個步驟,資料存放,這個先前也有提過了

以前沒有大數據分析,有一部份的原因是因為沒有足夠多的空間來存資料

所以當你拿到了大數據之後,你應該去想辦法找一個空間可以來堆放你的大數據

如果你的數據不會再變動了,那都好解決,頂多硬碟多掛幾顆

但是如果你的數據會源源不絕地冒出來,那或許你得先想想如何解決串流的問題

不要你將某一Data移到某個雲端存放的時候,機器已經在當下又多生出兩個Data啦

那麼你的串流速度就太慢了!

 

第三個步驟是加值處理,簡單來說就是對你的數據進行架構的建設、進行權重的分配

你一定要先有個想法,你要如何分析,從一大堆數據裡面挑出你想要的資料

這也就是上一篇講的,把大數據庫裡面的資料結構化

 

第四個步驟,就是數據分析拉,這邊就看你要如何分析你結構化的數據,每個人的方式不一樣

這邊就不多談,最簡單的當然就是統計,不過也有其他方法

 

第五個步驟,你也許會納悶不是分析完了,怎還有步驟?

當然還有,分析出來的東西,你沒拿來用,基本上還是垃圾

第五個步驟叫資料視覺化,妳可以簡單地把這個步驟當作做報告

如果你只是一個工程師,把報告直接寫到Code這也算是一種資料視覺化

不然如果是老闆要看到成果,你總不能拿一堆數字給他看,你要解釋

你要用別人看得懂的東西解釋清楚,這才有用

 

最後一個步驟叫實際應用,你分析了一大堆數據,你當然要把它拿來做應用

不管是要用在工程上還是商業模式上,基本上就看你分析的數據是哪一種

我想大部分的人不會無聊到去分析大數據,應該絕大部分都是工作

所以最後一步驟當然就是把你分析出來,建構出來的東西,實際套用在現實生活中

這才是最重要的!

 

 

 

 

 

 

 



LINE.png

我的LINE貼圖!點我點我

我的LINE貼圖!點我點我

 

我有粉絲專頁唷,如果喜歡我的朋友可以到我的粉絲專頁按個讚唷

 

arrow
arrow

    DoubleCool 發表在 痞客邦 留言(0) 人氣()