top of page
搜尋

IBM 推出 Telum II 和 Spyre Accelerator,加速 IBM Z 主機上的 AI 應用

Telum & Spyre

IBM(紐約證交所代碼:IBM)在 Hot Chips 2024 大會上揭示了最新的 IBM Telum® II 處理器與 IBM Spyre™ Accelerator 的技術細節。這些新技術將顯著提升 IBM Z 主機系統的處理能力,特別是在人工智慧(AI)應用領域,幫助企業更有效地運行大型語言模型(LLM)與生成式 AI。


IBM Telum II 處理器與 IBM Spyre Accelerator 的技術創新

Telum II 處理器是 IBM 為下一代 IBM Z 系統專門設計的核心處理器。它不僅在頻率和記憶體容量上有所提升,還整合了 AI 加速器核心,並且增加了 40% 的快取容量。這款處理器還具備新一代的數據處理單元(DPU),專為加速主機上的複雜 I/O 協議而設計,大幅提升系統操作的簡便性與關鍵元件的性能。


與 Telum II 處理器配合使用的 IBM Spyre Accelerator 則提供了額外的 AI 計算能力。Spyre 加速器晶片能夠支援多模型協同的 AI 模型應用,結合多個機器學習與深度學習模型,以提高準確性和穩定性。這種整合方法使 IBM Z 主機系統在處理生成式 AI 項目時更加高效。


Telum II 處理器的關鍵規格與性能指標

Telum II 處理器配備八個高性能核心,每個核心運行速度達到 5.5GHz,並擁有 36MB 的 L2 快取。這款處理器的虛擬四級快取容量達到 2.88GB,比上一代增長了 40%。內建的 AI 加速器核心允許低延遲、高吞吐量的交易內 AI 推論,計算能力比上一代增長了四倍。I/O 加速單元 DPU 的集成使得數據處理效率提升了 50%,這讓 IBM Z 能夠更加有效地處理大型 AI 工作負載與數據密集型應用。


Spyre Accelerator 的強大 AI 計算能力

IBM Spyre Accelerator 是專為企業級 AI 模型與生成式 AI 應用設計的加速器。該加速器擁有多達 1TB 的內存,能夠透過八張常規 I/O 模組卡協同工作,支援主機上的 AI 模型工作負載。每張卡的功耗不超過 75W,且每個晶片配備 32 個計算核心,支持 int4、int8、fp8 和 fp16 等數據類型,適合低延遲和高吞吐量的 AI 應用。


IBM Z 主機系統的未來展望

Telum II 處理器將成為下一代 IBM Z 和 IBM LinuxONE 平台的核心處理器,預計將於 2025 年提供給 IBM Z 和 LinuxONE 客戶。同時,IBM Spyre Accelerator 目前處於技術預覽階段,也預計將於 2025 年推出。這些創新技術將使企業能夠在大型語言模型與生成式 AI 項目中獲得更高效、更可靠的運行效果,為數據驅動的業務提供強大支援。


1 次查看0 則留言

Opmerkingen


bottom of page