當 CUDA 遇上 Denver , Tegra 不光只是娛樂級應用處理器

當 CUDA 遇上 Denver , Tegra 不光只是娛樂級應用處理器

這次 GTC 的新架構規劃表當中, NVIDIA 宣佈下兩代 Tegra 的關鍵特性,其中將於明年正式推出的 Logan (金剛狼)雖仍持續使用 ARMv7 指令集的 CPU 架構,不過 GPU 卻準備導入與桌上型 GPU 同級的 Kepler 架構,這也意味著 ARM 架構的應用處理器將獲得真正的運算級 SoC 設計。

跳轉繼續

而密謀多年但似乎消聲覓跡一陣子的 Project Denver 也緊跟在後,預計於 2015 年問世,也就是再下一代的 Tegra "Parker(蜘蛛人)",除了 GPU 將換上同一時期的全新 GeForce 架構 Maxell 外,更將 CPU 換上採用 ARMv8 64 位元指令集的 Denver 核心(但 NVIDIA 並未透露採自主架構或 ARM Cortex-A50 架構 ),至此的 Tegra 更將 CUDA 攜手 ARM 引領到高效能運算的層級。

而 NVIDIA 將最擅長的 GPU 大量且積極的導入 Tegra 產品線,意味著 ARM 與 GPU 的異構運算條件逐漸成熟,才會使 NVIDIA 自 08 年開始發展的 CUDA 平行運算技術導入 Tegra 當中。另一方面更表示高效能運算不再只是躺在研究中心內遙不可及的領域,而是足以在不知不覺當中改變人類日常生活的平民化技術。

當 CUDA 遇上 Denver , Tegra 不光只是娛樂級應用處理器

事實上,自今年開始,手持設備的平型運算運用就已經數度被提到,在手持設備相機上的應用大大改變手機拍照的形式與機能;只要一張照片,透過 CPU 、 GPU 與 DSP 三者合作下,達到即時的 HDR 渲染,或是高速的追蹤拍攝物體、精確的臉部辨識等等,甚至大大超越傳統相機的機能,這都是拜手機應用處理器的 GPU 加速與異構運算所賜。

而 NVIDIA 選擇下放 CUDA 核心架構到 Tegra 當中,更代表許多原本用於 PC 的伺服器與運算中心的 CUDA 平行運算,也能在這樣一顆小小的應用處理器被實現;且今年 ARM 架構也傳來捷報,被百度導入作為數據資料庫的硬體架構。若於支援 64 位元指令集的 Parker 實做,透過更高的記憶體容量支援,加上 ARM 最擅長的多核戰術,以大量的 Paker 處理器進軍高效能運算甚至超級電腦也不再是空談。

當 CUDA 遇上 Denver , Tegra 不光只是娛樂級應用處理器

當然 Tegra 也不可能忘掉手持設備的領域,藉由 64 位元與 CUDA 核心 GPU ,手機、平板引發的口袋內的運算革命又將更上一層樓, x86 的高效能運算優勢將漸漸流失。尤其別忘了現在手機、平板的效能不斷提昇,已經有許多原本專精於電腦的高階工具軟體也轉戰手持設備,若手持設備運算效能再次提昇,靠手機與平板進行進階的修片、影像渲染也不是難事。

筆者個人認為, NVIDIA 今天推出 Kyala 也是為了未來布局,尤其當黃仁勳展示即時的光線追蹤時,相信不少在現場的軟體與伺服器開發者已經意識到 Kyala 就是一個讓他們提前為 Tegra 平行運算做準備的開發平台。不僅可供伺服器開發商驗證 ARM 搭配 CUDA 的低功耗、高效能運算的可行性,在 Kyala 實做的軟體,未來可以直接透過向下相容的方式套用在新的 Tegra 平台上,為未來預先做準備。