旨在培育海量數據分析人才,微軟與中華資料採礦協會共同成立資料科學研究院

旨在培育海量數據分析人才,微軟與中華資料採礦協會共同成立資料科學研究院

台灣微軟今天宣布與中華資料採礦協會共同成立微軟資料科學研究院,針對新一波海量數據資料分析所需的科技人才進行培育,希望能夠孕育更多的資料科學家人才。資料採礦( Data Mining )跟礦業可是一點關係都沒有,這是一種因應數據資料分析而生的行業,彷彿挖礦一樣從海量的數據中挖掘有意義的資料並且進行琢磨(分析),並因此產生珍貴的寶藏。

微軟營運暨行銷事業群總經理康容(照片右二)表示,過去談到海量數據分析,都集中在以資料儲存為主,然而這些海量數據不加以分析就無法產生價值,就如同寶石、礦物不加以琢磨就如同一塊普通的石頭一樣。

一般人也常認為海量數據分析是與民生相當遙遠的專業技術。不過在網際網路與雲端服務普及的今日,每個網路服務使用者都是海量數據來源的一份子,同時也是海量數據分析下的受惠者。

例如微軟與北京就曾進行交通資訊合作,透過為計程車安裝感測器的方式進行交通分析,並將成果公佈在網路上,借此提供行車時的路況分析與參考,而且還進一步的解析某個經常性路段容易塞車的原因是因為交流道閘道不足並加以改善。其他像是地震預測、天氣預測、消費者行為分析以及客製化廣告推播亦都是屬於海量數據分析的結果。

為何需要海量數據分析?海量數據可用在三種行為,分別是評估、即時決策以及預測。例如分析客戶購物行為習慣借此決定是否增加特定商品的叫貨量;或是發生道路壅塞時從目前的交通狀況決定疏散路線;亦或從近期的徵兆推測海嘯、地震的發生。

然而海量數據研究所需的人才目前卻不多,因為海量數據需要有專業領域的知識,但同時又需要熟悉海量數據的分析能力,是故微軟與中華資料採礦協會共同成立微軟科學資料研究院,希望為培育新一代的"資料科學家"盡一份心力。微軟表示,他們在海量數據分析並非作為研究單位,而是提供所需的專業工具與知識,讓資料科學家能夠專注於數據分析上。

旨在培育海量數據分析人才,微軟與中華資料採礦協會共同成立資料科學研究院

立可人事科技事業群顧問諮詢總監鄧耀中(開版照片右一)也表示,現在海量數據分析已經蔚為顯學,各大企業無不透過海量數據分析進行客戶行為解析,並藉此針對客戶需求量身打造感興趣的服務。

他也提出阿里巴巴創辦人馬雲對海量數據的一些看法,表示過去海量數據都是封閉研究,然而將海量數據開放反而更能增加價值。不過不同於馬雲表示還想不到應用前先準備好數據的觀點,他認為以台灣產業界的現況,反而更應該先將對海量數據分析所需的思維準備好,並認為不能夠因為海量數據分析結果影響隱私以及進行行為引導。

旨在培育海量數據分析人才,微軟與中華資料採礦協會共同成立資料科學研究院

中華資料採礦協會榮譽理事長謝邦昌教授(開版圖左二)表示,台灣在進行海量數據分析行為相當盛行,例如台灣醫界就透過健保局開放的資料庫進行海量數據分析,並且做成許多珍貴的醫療分析報告,也因此中國的學術單位亦常邀請台灣的專業人才輔導海量數據研究。

不過他亦認為多數的海量數據研究者仍停留在知識不公開的階段,他相信透過將研究成果開放能夠獲得更多的可能性。例如搜尋引擎的便利使得一般使用者可輕易的獲取大量的資料與知識,並促成人類的不斷成長,而這些海量數據分析的成果越開放,越有助於人類的進化。

謝教授提出,現在已經進入一個可以靠賣訊息與賣知識的時代,無論是結構化資料或是非結構化資料都能加以分析,然而要分析這些資訊,就需要同時結合專業知識以及專業數據統計的資料科學家或是兩種不同人才的協作,他也期許與微軟一同創辦的微軟資料科學研究院能培育專業的資料科學家,為海量數據分析提供優秀的人才。