GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

百度副總裁暨百度美國研發中心總經理鄭子斌

身為中國最大的網路搜尋與服務公司,百度也相當積極的投入大數據分析以及機器學習相關的研究,而除了中國之外,百度也在美國矽谷設立百度美國研究中心,專為機器學習( Machine Learning )做相關的技術開發,尤其這幾年基於深度神經網路的深度學習( Deep Learning )蔚為顯學,百度也在此領域投入相當的開發。

而機器學習也是 NVIDIA 近年於 GPU 加速運算領域相當重要的一環,百度此項目相關的科學家也長期與 NVIDIA 合作,故兩者有著相當的合作關係;在 GTC 2015 開展前一天,也有機會參訪位於矽谷 Sunnyvale 的百度美國研究中心與他們進行訪談,由百度副總裁暨百度美國研發中心總經理鄭子斌(開版照片),百度技術部高級總監呂厚昌(下方照片右),百度傑出科學家吳韌博士(下方照片左)受訪。

GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

百度技術部高級總監呂厚昌(照片右),百度傑出科學家吳韌博士(照片左)

百度為何由一家中國的網路搜尋與服務龍頭投入深度學習?主要還是以提供更好的服務為前提,尤其在百度發現在智慧手機普及後,語音以及圖片搜尋的需求越來越大,加上因應智慧穿戴設備、 IoT 設備的操作方式將仰賴語音辨識,百度預測未來五年後語音以及圖像搜尋將與文字搜尋各佔 50% ,也因此將深度學習視為解決語音與圖像搜尋的重要解決辦法。

百度的優勢也就是由旗下各類的服務產生的大量數據,而深度學習比起傳統的機器學習更仰賴龐大的數據,只要運算力充裕,有越龐大的數據量,自然就可得到更好的學習效果;不過以目前百度的做法並非讓系統完全的自動化學習,畢竟自動化學習速度較慢,百度則是在經過一段時間後投入新的學習數據並加以系統調整,加速學習的成效。

另外,百度也相當重視大數據的應用,他們希望能夠透過大數據的方式解決中國各類問題,尤其以解決民生問題為優先;百度也將與中國並進,成為世界一流的創新中心為目標,故積極的投入深度學習以及大數據的結合。

GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

雖然深度神經網以及深度學習都是相當早就有的概念,然而在近年平行運算以及數據量激增下,深度學習技術得到飛躍性的成長;尤其試 2012 年圖像辨識系統藉由深度學習的方式得到飛躍性的辨識結果後,使得一度停滯的深度學習開始起飛。

百度投入深度學習以及大數據的基石,也就是由旗下的搜尋以及各式服務作為基礎,甚至像是百度知道一類的軟性服務,也能將其資訊用於作為文字搜尋以及語意判斷的參考資料;另一個就是百度不僅是投入技術研究,也針對相關應用架設超級電腦,且規模應該在中國僅次於天河一號。

為何需要興建高效能的超級電腦?百度的想法則是源自於中國聖賢的經驗,以孫子的少算聖多算、班固的鍵多才思廣以及孟子的從大看也要小看,希望以夠強大的運算力為後盾,突破過往大數據分析與深度學習的瓶頸。

百度的想法也很簡單,透過既有的演算法並輔以最高效能的超級電腦突破過往的門檻,但另外還有一項關鍵就是百度並非使用單一超級電腦,而是基於分散式運算的方式大幅提升效能;分散式運算說起來原理不難,就是把運算內容分割給多個伺服器演算後將結果整合,然而卻鮮少有廠商這樣做,因為該如何分配運算內容成了難題。

是故百度不僅在深度學習上擁有演算邏輯,也包辦了硬體相關架構以及軟體技術,尤其解決資料傳輸的頻寬與延遲,才能將原本男子實現的多節點運算用於深度學習領域,並得到龐大的運算能力。

GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

百度甚至還有一套專為深度學習架設的深度神經網運算系統,單就通用運算僅在全球超級電腦排行約兩百多名,但是單純就深度神經網運算領域,則是目前全球該領域最強的運算系統。

至於百度如何應用目前將深度學習的成果?目前而言仍是用在一般的搜尋以及廣告投放應用;尤其圖像識別技術目前處於基礎服務應用階段,仍未找到殺手級的應用,不過百度認為,若能提升影像辨識的精確度,如能透過分析肌膚特徵判斷是否有潛在疾病,會是未來影像辨識的可能性。

GTC 2015 :百度美國研究中心談深度學習,以分散式運算攜既有演算法突破運算力極限

百度在矽谷設立分部於 2011 年,不過初期以招募矽谷的中國留學生與外籍專業人才為目的,直到 2014 年轉型為研究中心後,才開始擴大規模,如今約有百人左右的員工,非中國籍員工約佔 ⅓ 。

雖然百度暫未有進軍美國的計畫,又為何要在美國設立研究中心?根據百度研究中心總經理表示,主要的原因還是人才與相關技術在中國難尋,而矽谷如今仍是美國深度學習與運算資訊的重鎮,雖然服務應用仍以中國百度為主,但在美國矽谷設立研究中心則有助結合美國最新的資訊以及當地的優秀人才使技術更為茁壯。

你或許會喜歡

跟回合制遊戲說掰~掰~不再無聊的手遊在這裡