無庸置疑,關於 HPC 與 AI 的融合,也就是利用單一環境同時支援 AI 和 HPC 兩種不同工作負載,已逐漸成為大勢所趨。
一方面,HPC 環境向來擁有強大運算力,很適合執行 AI 工作負載;另一方面,HPC 執行過程也需要利用 AI 手法,滿足其中許多段落的模擬與優化需求。兩股力量相乘,可匯聚為充沛動能,成為企業下一波數位轉型必備利器;不過,針對底層基礎架構、HPC/AI 軟體等各方面執行複雜的調校工作,其間有許多關卡亟待克服。 不可否認,企業想要靠一己之力建置 HPC 與 AI 通用環境,還要發揮強大運算效能,難度甚高,過程中難免頻頻踩坑、撞牆。
鑒於此,雲達科技(QCT) 協同技術夥伴 Intel®,採納 Intel® Xeon® 可擴充處理器,共同發表「以工作負載優化,徹底發揮企業級 HPC 與 AI 最大效能!」白皮書,期望幫助企業理解,若要兼能展現 HPC 與 AI 的優越性能,除了需要建置高性能的硬體設備外,更需要懂得運用加值套件,雲達科技提供預先處理好的編譯和佈署工具,讓客戶不必從零開始、只需要做少許的微調,便能省時省力完成上層應用軟體的設置、並且流暢運行。
在 IT 應用上,若在先天(系統建置時期) 踏錯起步,就很難冀望後天(系統維運時期) 能妥善發揮;因此企業建置 HPC/AI 系統之初,需搭配良善、專業的調校,才能完整釋放潛能,避免大材小用的荒謬狀況,且預先消弭企業數位轉型旅程中的干擾變數。欲知 QCT 如何化繁為簡,幫助企業在免於自行摸索與試誤,以及如何把調校基本功做到扎實到位?敬邀您踴躍下載白皮書,藉此一探究竟!
滿足工作負載最佳化應用需求
針對工作負載最佳化應用需求,QCT 提供系統化的導入步驟,可依照 7 階段方法論,
進行工作負載的執行需求分析、硬體設計、軟體與應用程式平臺設計、工作負載優化、檢討與改善等。
QCT 工程團隊訪談客戶進行討論,先了解應用系統(Application)和數據的屬性和行為,找出須優先調校的關鍵工作負載(Workload),隨後也需要知道客戶的IT基礎架構與應用程式部署狀態,以及客戶目前面臨的效能痛點與期望改善的目標。
根據第一步調查的內容,決定資源配置方式與優先順序,並且設定調校目標與工作負載最佳化評估的方法步驟。
設計、建立適合的硬體基礎架構平臺,並且依照客戶需求、產業領域專屬應用程式的特性,彙整出工作負載應有的屬性 ,再調整硬體設備配置、系統環境與軟體堆疊,以及整體基礎架構等部分。
QCT 將協助進行應用程式行為與特性的剖析,以及界定效能基準。當中將搭配適合的軟體工具進行探測與觀察。
實際執行應用程式、產生工作負載,並且進行除錯,當中將會同時收集剖析資料,再予以分析,以便找出效能瓶頸,之後再進行調整相關設定,進而發現提升效能的方式。
最後一個階段,則是對這個新設計的系統進行整體調校,最終得以實現最佳化的工作負載,並且產生效能優化的報告。
HPC 與 AI 不再只是學術與公部門的專屬應用,許多行業與專業領域如今也都需要擁抱這類效能密集的技術平臺,以便拓展新的可能性,QCT 與 Intel®
協力建造多種解決方案,滿足不同客戶的需求。欲了解更多資訊,請立即下載
「以工作負載優化,徹底發揮企業級 HPC 與 AI 最大效能!」白皮書