HPC/AI 企業致勝白皮書

今時今日,各個垂直產業領域都積極推動數位轉型,因而急需借助各種數位科技,藉以加速打造創新的應用場景與商業模式;毫無疑問,AI 肯定的是其中最關鍵的技術項目,惟企業機構欲開創 AI大局,有必要搭配 HPC 技術、以 Scale Out 方式擴大深度學習計算規模,才可望發揮極大化 AI 運算力,加速創新轉型進程。

顯而易見,AI 與 HPC 的融合,將是今後至關重要的趨勢。鑒於此,廣達旗下雲端伺服器大廠雲達科技(QCT)攜手技術夥伴Intel®,採用 Intel® Xeon®可擴充處理器技術,公開發表「HPC/AI 企業致勝白皮書」,為產學研各界闡述如何利用軟硬體一站到位的完整解決方案,快速輕易地打造 HPC 及 AI架構,讓研究人員得以跳脫艱澀的基礎架構整合議題,把心力聚焦在所要解決的研究難題上,從而大幅縮短應用開發專案期程。

透過此份白皮書,您將見識到雲達科技如何基於同時整合了伺服器、儲存、網路三大技術的先進硬體架構,輔以一套適用人工智慧與高效能運算的「QCT Platform on Demand(QCT POD)」軟硬體整合系統,再進一步因應不同垂直產業需求進行預先配置與整合,透過模組化達成基礎架構的最適配置,使企業藉由最少人力與時間成本,迅速建構兼具彈性與延展性的 HPC 與 AI 叢集系統,展現強大的創新應用開發力。

此外,雲達科技的 HPC 與 AI 解決方案,已在全球市場歷經千錘百鍊,至今締造眾多指標性成功案例,包括堪稱台灣之光的兩套國家級超級電腦系統「台灣杉二號」與「台灣杉三號」。欲知雲達科技如何貢獻絕佳的軟硬體整合設計,成就如此偉大的應用實績?敬邀您踴躍下載白皮書,藉此一探究竟!

台灣之光「台灣杉二號」&「台灣杉三號」

雲達科技(QCT)與國內廠商合作參與國網中心下一代超級電腦的開發,協力建構支援 AI 與 HPC 應用需求的叢集系統,打造出在臺製造(made in Taiwan)的國家級 AI 超級電腦 Taiwania 2、Taiwania 3。它的誕生,標示了臺灣將 AI 視為未來發展的重要核心理念,之後,這座系統設置在 AI 雲端平臺「臺灣 AI 雲(Taiwan Computing Cloud,TWCC)」,支援學術與研究的社群使用,提供強大的 AI 叢集系統,為超級電腦發展專案,同時也交出漂亮的成績單,成效顯著,減少國網中心維運成本,支援 AI 新創研究及科技抗疫 2.0 計畫,展現硬體設計實力與HPC/AI軟體架構的最佳搭配。

台灣衫三號建置效益

除建立兼具低耗能、高效能及可擴充的HPC叢集系統,提供使用者一個完整簡便的使用開發環境並優化其工作負載外,更可讓系統管理人員能透過快速部署與管理工具,即時監管控系統動態與管理整體運算資源,以降低管理風險與負擔。

  • 高效運算服務:具備多節點高效能運算主機及低延遲資料傳輸網路
  • 節能機房設施:採用水冷技術以大幅提高機房能源效率及降低維運成本
  • 快速系統部署:提供管理人員自動化環境快速部署及系統管理功能
  • 簡便操作使用:提供完整應用軟體工具以利研究人員執行及開發應用程式
  • 優化工作負載:整合異質計算資源在單一系統並針對不同工作負載予以優化
  • 彈性整合擴充: 採開放式架構具獨立運作及彈性擴充能力並可介接即有系統
  • 即時維運管理:透過系統監管控平台掌握系統即時動態以降低管理風險及負擔
  • QCT Platform on Demand
    一條龍的建置優勢

    支援HPC與AI應用需求,兼具使用彈性與擴充性,雲達科技採用 Intel® Xeon®可擴充處理器技術開發的 Platform-on-Demand(QCT POD)整合架構,是一套適用於人工智慧與高效能運算的軟、硬體整合系統,底層是雲達科技設計的伺服器、儲存系統、網路設備、邊緣設備,以及機櫃,上層可架設高效能運算、軟體定義儲存系統,以及雲端基礎架構,也提供管理建構模塊,統籌整個IT基礎設施的日常維運管理。

    同時,雲達科技也提供系統管理工具,而能協助用戶建置預先設定與通過驗證的叢集計算環境,搭配經過最佳化調校的管理與監控系統,確保IT環境的快速部署,以及計算資源管理的簡易操作,並且可透過單一網頁介面管理HPC與AI叢集系統,解決企業多元的工作負載類型。

    QCT POD Manager主要功能介紹

    快速部署

    • 自動化軟體系統建置與組態設定
    • 內建軟體程式庫,提供容器映像與系統軟體套件
    • 韌體與軟體驅動程式自動安裝

    系統監控

    • 即時監控系統整體狀態、服務狀態、效能、硬體資源使用率、健康狀態 提供診斷工具,因應效能測試評估與調校需求

    系統管理

    • 帳號管理:身分認證、權限授與
    • 資源管理、排程執行指定的工作、產生狀態統計報告
    • 容器部署與管理
    • 叢集系統管理、事件警示、通知

    開發環境

    • 圖形化遠端桌面工作環境
    • 支援多人使用的Jupyter Notebook自動化處理環境
    • 一應俱全的開發工具,包括:編譯器、程式庫、應用程式框架、資料視覺化呈現工具

    最佳化應用程式

    • 支援高效能運算工作負載
    • 支援人工智慧工作負載
    • 支援資料分析工作負載

    雲達科技「HPC/AI 企業致勝白皮書」

    協助客戶端到端打造世界一流超級電腦