以第 4 代 Intel® Xeon® 可擴充處理器為靠山,加速推進商業決策分析

用兵作戰貴在神速,現今商業競爭的決勝秘訣亦無不同;越能最快進佔市場的企業,越有希望成為贏家。因此近年許多企業想方設法增強運算能力,為的正是不斷改善各項工作負載的效能,展現出讓對手望塵莫及的經營節奏。

鑒於此,英特爾在第 4 代 Intel® Xeon® 可擴充處理器中,特別置入多種基於獨立電路設計的硬體加速器,期望提高 AI、HPC、網路、儲存、資安、資料分析等工作負載的執行效能與吞吐量,讓有志推動業務創新的企業,如願搶得致勝先機。

接下來的篇幅,我們將為您介紹第 4 代 Intel® Xeon® 可擴充處理器的「分析加速器」(Analytics Accelerator)。當前多數企業正致力打造資料驅動型組織,急需藉由資料分析來找出政策施力的焦點;對企業而言,如何在最短的等待時間、最低的資源能耗下,及早獲取資料分析成果,可謂重要課題。由處理器直接搭配內建加速器的模式,無庸置疑的是助力資料庫與分析效能升級的最快捷徑。

三大加速器相挺,讓處理器全速處理分析工作

談及第 4 代 Intel® Xeon® 可擴充處理器內建的分析加速器,主要涵蓋三大類,分別是 Intel® QuickAssist Technology(Intel® QAT)、Intel® Data Streaming Accelerator(Intel® DSA),及 Intel® In-Memory Analytics Accelerator(Intel® IAA)。

也許有人好奇,以往在處理器未內建硬體加速器的時期,企業一樣可執行資料庫和分析工作負載,如今搭配加速器,會對分析工作產生什麼樣的影響?

事實上,過去企業是動用性能優異的處理器核心來從事分析工作,但這些核心不只做分析,連帶也執行資料搬動、資料複製等事務,這樣的用法顯然太過「奢侈」。然而今天若有加速器的輔助,便可將週遭的瑣事卸載到加速器,使處理器核心得以保留更多運算能力、專注投入最有價值的資料處理任務,避免因「備多力分」而延緩產出分析成果的時程。以前面提及三大分析加速器之一的 QAT 為例,即能幫助處理器釋出高達 98% 的額外工作負載能力 ,替代 CPU 處理大部分的加解壓縮工作。

顯而易見,QAT 這個額外電路,可望在 CPU 承載大量資料傳輸或分析時,適時分擔加解密、加解壓縮等繁重工作。至於另一項分析加速器 DSA,擅於搬動資料;從前 CPU 靠一己之力完成分析工作,過程中必然需要去記憶體裡頭搬移資料,假設這回要搬的是從第 1 到 第 63 位址的數據,只能依序從 1、2、3…逐一搬到 63,耗費多達 63 個工作週期,現在 CPU 可要求 DSA 代勞、幫忙搬動這些資料,如此 CPU 就能騰出大量時間,好整以暇從事更具意義的任務。

有關第三項加速器 IAA,專長亦是加解壓縮,但與 QAT 不同之處,在於 IAA 側重在 In-Memory 資料的加解壓縮。當資料在 CPU、記憶體之間移動時,需要消耗運算資源與時間,IAA 此時即可介入資料搬移工作,提供快速的資料交換,並同時完成壓縮或是解壓縮工作;爾後 CPU 若要從記憶體取用資料,即可交由 IAA 代為執行這項任務,以減輕 CPU 的工作量。

每瓦效能數倍提升,促使 TCO 應聲銳減

接著藉由一些測試實例,來彰顯三大加速器的存在價值。首先談到 QAT 加速器,企業須搭配使用 Intel QAT Engine 軟體。當企業在 Microsoft SQL 資料庫啟動 Backup Function 時,即需執行大量加解壓縮作業;若以此情境為基準,透過「無 QAT」、「有 QAT」等條件先後執行相同的加解壓縮任務,證明後者的執行效率高出 2.3 倍,速度效益堪稱顯著。

其次談到 DSA 加速器,需要搭配的軟體為 Intel Data Mover Library。DSA 強項在於搬動資料,應用觸角相當廣、遍及常見的 In-Memory 資料庫或 ERP 系統;此處我們可直接以 IOPS 為評比依據,經過實測,證明一旦有 DSA 的輔助,比起沒有 DSA 的狀態,吞吐速度約提升 1.7 倍。

有關 IAA 加速器,則需搭配使用 Intel Query Processing Library、Intel Data Mover Library 等軟體。此處我們以常見的資料庫效能量測工具 RocksDB 為基準,以檢驗在有或沒有 IAA 的狀態下,執行相同加解壓縮工作的速度落差;經過量測,沒有 IAA 的狀態下、平均加解壓縮速率為 2.08 Mbps/sec,反觀有 IAA 的狀態下則增至 4.36 Mbps/sec,增幅達到 2.09 倍之多 。

此時進一步以 Perf/W、也就是近年備受矚目的每瓦效能作為驗測標準,並將 Intel 的第 4 代處理器 8490H、第 3 代處理器 8380 同列為比較對象。針對 QAT 部份,在 QAT.zip(QAT vs. zip/OOB)測試條件下,8490H 每瓦效能為 8380 的 6 倍。

在 DSA 方面,若以 SPDK 128K QD64(Large Media Files)vs. OOB 為測試條件,8490H 每瓦效能為 8380 的 1.82 倍。至於 IAA,以 RocksDB(IAA vs. ZSTD)為測試條件,8490H 每瓦效能則是 8380 的 2.28 倍。換句話說,假使企業以第 4 代 Intel® Xeon® 可擴充處理器搭建資料分析運算環境,並全面啟用 QAT、DSA 及 IAA 加速器,無論大大小小工作負載,相較於前一代處理器均能展現 1~6 倍不等的每瓦效能精進。

換個方式做比較。假設企業原來以第 3 代 Intel® Xeon® 可擴充處理器打造資料分析環境,共計佈建 50 台伺服器;倘若要維持原本環境的分析性能,只要換置成第 4 代 Intel® Xeon® 可擴充處理器,僅需佈建 18 台伺服器,連帶使每年耗電量減少 15.4 kW、碳排量減少 366,000 公斤,換算總體持有成本將大幅銳減 52%。足見如果企業既想快速獲得商業深入解析,又想增進電源效率、滿足淨零碳排需求,第 4 代 Intel® Xeon® 可擴充處理器正是最佳解方。

第 4 代 Intel® Xeon® 可擴充處理器內建的分析加速器,究竟擁有哪些價值?以其中 IAA 為例,證實能將In-Memory 資料加解壓縮的速率,從 2.08Mbps/sec 提升為 4.36Mbps/sec,大增2.09 倍,價值顯而易見。