以下,是我聽演講,上網搜尋找到的相關資料,分享給大家
然後我很懶得去抓圖片來這邊貼,所以沒有圖片
本來想說要不要錄成影片,但是太麻煩了,而且也不知道有沒有人看
如果有錯誤的地方,再請各位厲害的大大指教,謝謝
===================================================
為什麼我們需要大數據?
這似乎不是一個我們需不需要的問題,很多科技發展都是為了解決無法解決的事情
並且因應著儲存系統的進步,大數據開始被應用基本上就是必然的
為什麼呢?當有一天,某些數據大多太大,難以分析的時候
你一定要想辦法解決,OK,人類想出來的方式就是大數據
一間半導體廠,不論是台GG或是UMC,光一片晶圓進去開始生產,所記錄的Data就多到難以想像
一塊晶圓要到能夠使用,至少經過幾百道製程,也不知道經過幾台機器
產生的數據紀錄,光一筆數據的欄位就多到爆炸啊,說不定大到你連EXCEL都打不開
進入A製程時間、出去A製程的時間、在A製程裡面的時間、溫度、濕度、等等一大堆
就拿半導體廠來說好了,機器24小時一直在Run,你存了一大堆數據,都無法分析?那是能幹嘛?
所以當儲存系統被升級之後,大數據才開始被應用
而這也是因為人類有這個需求,所以才會發展出來的技術
另外,我想說的是,大數據不單代表是數據
我的意思是指,「數據」不一定是數字,也有可能是影像檔、錄音檔
影像檔、錄音檔這些東西為了要分析,也是需要大數據的幫忙,不然一個影片那麼大要怎麼分析呢?
如何分析影像檔和錄音檔,這就是另外一件事情了,這邊先不說
我想大家都有用過電腦的複製與貼上,CTRL+C、CTRL+V
當你要分析一項數據,當然不是在同一台機器上分析,一定是移動到某超級電腦做運算
OK那好啦,當你剪貼一個檔案很快,但是如果同時剪貼一堆檔案...那就很慢了
而且有可能你在剪貼的過程中,早就已經出現新的檔案了
所以我們需要大數據分析系統來幫助我們儲存與運算
不過,要如何串流你的數據與運算、儲存系統,這就是每個使用者需要考慮的事情了
也許大家會好奇,數據存那麼多,真的會每一筆都分析嗎?
你覺得餐廳的菜色那麼多,你有可能每道菜都吃嗎?
當然不可能嘛,所以我下次就會講到如何去分析這些大數據
那就先這樣吧
如果有錯誤的地方,歡迎各位大大跟我講,或是與我討論
我有粉絲專頁唷,如果喜歡我的朋友可以到我的粉絲專頁按個讚唷
留言列表