增強 AI 性能的測試解決方案

我們提供更廣泛的解決方案來測試人工智能基礎設施

為人工智能開發和部署提供端到端支持

二十多年來,Teledyne LeCroy 在數據中心人工智能技術的可靠運行中發揮著關鍵作用。我們的測試解決方案用于整個生態系統,包括高性能計算和分析、允許高效移動和訪問數據的網絡以及作為云中冷熱存儲支柱的存儲設備。我們通過為超大規模環境中使用的 PCI Express、CXL、NVMe、千兆以太網和 SAS 等技術提供專業的解決方案來實現這一點,這些技術面向設計和測試工程師(從早期采用者到系統集成商)。

    人工智能 - 互連

    計算

    人工智能應用需要數據中心的高性能計算來以高吞吐量和低延遲分析大量數據,這推動了現代計算機和以數據為中心的架構的發展。
    人工智能 - 網絡

    網絡

    在機架、數據中心和校園內移動大量數據加速了對更快、更高效的網絡技術的追求。
    人工智能 - 存儲

    存儲

    對存儲容量的不斷增長的需求以及從任何地方訪問數據的追求推動了云和混合存儲解決方案以及存儲接口技術的發展。

    計算 - 互連、處理、數據流和內存管理

    人工智能變革力量的核心是使這一切成為可能的計算和處理要求。人工智能工作負載推動數據中心高性能計算 (HPC) 的轉型,每秒提供數萬億次計算,以驚人的速度和準確性實現圖像識別、自然語言理解和趨勢預測。并行處理系統使人工智能能夠高效地執行多任務,反映出人腦的復雜性。

    代表 PCIe/CXL 的 AI 大腦的彩色圖像
    管理記憶和人工智能的頭部彩色圖像

    Teledyne LeCroy Summit 分析器、訓練器、干擾器、插入器和測試系統有助于構建和優化使用 PCIe 來支持 AI 的更快和更新系統。這些設備和計算系統使用高速接口將 AI 加速器(例如 GPU 和定制硅片)連接到中央處理器 (CPU)。它的不斷發展確保 AI 系統始終處于技術前沿,隨時準備應對未來數據驅動世界的挑戰。

    • 可擴展性:PCIe 每一代的帶寬都會翻倍,以滿足 AI 應用日益增長的需求。最新的 PCIe 6.0 規范提供了每針 64 GT/s 的數據傳輸速率,確保 AI 系統能夠處理日益復雜的任務。
    • 多功能:PCIe 的用途非常廣泛,從用于深度學習系統的大型芯片到較小的空間加速器,后者可以擴展以處理需要數百 petaFLOPS 處理能力的廣泛神經網絡。
    • 能源效率:較新的 PCIe 版本引入了低功耗狀態,有助于提高 AI 系統的能效。這對于可持續且經濟高效的 AI 運營至關重要。
    • 互聯性:PCIe 促進了 AI 基礎設施內計算、加速器、網絡和存儲設備的互連,從而實現了具有更低功耗和更大覆蓋范圍的高效數據中心解決方案。

    CXL 在塑造 AI 格局方面具有重要前景,而 Teledyne LeCroy 解決方案是測試和優化當今 CXL 系統的重要方法。使用支持 CXL 測試和合規性的 Teledyne LeCroy 解決方案,可以實現內存效率、延遲減少和性能 - 所有這些都對于保持低延遲和高吞吐量至關重要。這對于需要快速訪問大型數據集的帶寬密集型 AI 工作負載尤其重要。

    • 內存容量擴展:CXL 允許將大型內存池連接到多個處理器或加速器。這對于處理海量數據集的 AI/HPC 應用程序至關重要。
    • 減少延遲:CXL 的低延遲設計可確保數據在計算元素之間快速傳輸。AI/ML 工作負載受益于最小化的等待時間。
    • 互操作性:CXL 促進與供應商無關的兼容性,允許不同的加速器和內存模塊無縫協作。
    • 增強內存帶寬:CXL 顯著提高了內存帶寬,確保數據密集型工作負載能夠無瓶頸地訪問數據。

    網絡 - 高速以太網、數據吞吐量、結構和網絡

    最近的大型語言模型(如 Chat GPT)需要通過可擴展網絡快速訪問來自不同來源的數億個參數。為了確保合適的用戶體驗,網絡必須支持低延遲,并高效傳輸針對這些新工作負載優化的數據。

    有線連接 AI 基礎設施
    用于 AI 后端測試的程式化全球網絡

    以太網支持從 10Mbps 到 800Gbps(千兆位每秒)的數據傳輸速率,1.6Tbps(太比特每秒)的速率即將到來。這些速度對于處理人工智能通常使用的海量數據集至關重要。

    • 實時響應:低延遲對于 AI 系統至關重要。以太網可最大限度地減少延遲,確保 GPU、CPU 和存儲設備等組件之間的及時交互。
    • 實時決策:以太網可實現實時人工智能驅動的決策。其高帶寬可確保人工智能節點之間的高效通信。
    • 無損網絡:傳統以太網在擁塞時可能會丟包,影響 AI 模型的準確性。然而,新興技術承諾“無損”傳輸,即使在高負載下也能確保數據完整性。
    • 可擴展性:隨著 AI 模型變得越來越復雜,可擴展的基礎設施變得至關重要。以太網通過連接其他服務器和設備實現無縫擴展。以太網可適應其指數級增長,確保高效的連接和數據交換。

    Xena 以太網測試平臺可幫助公司優化和確保其 AI 后端網絡結構的未來發展,以處理大量時間關鍵型流量。用于 AI 工作負載的數據中心架構通常采用脊葉結構,通過低延遲 L2/L3 網絡基礎設施以 400-800Gbps 端口速度連接數千個 AI 加速器和存儲解決方案。融合以太網上的 RDMA (RoCE) 是存儲數據傳輸協議的一個有前途的選擇。

    • 數據中心橋接 (DCB):促進 RDMA 數據包(無損流量)以及常規盡力流量(有損流量)的高吞吐量、低延遲和零數據包丟失傳輸。
    • 優先流量控制 (PFC):當緩沖區填滿超過某個閾值時,通過提示發送方暫時暫停發送數據包來防止數據包丟失。
    • 擁塞通知(CN):RoCEv1 和 RoCEv2 在網絡設備之間實現了一種信令,可用于減少無損網絡中的擁塞蔓延、降低延遲和提高突發容忍度。
    • 增強流量選擇 (ETS):能夠為每種服務類別 (CoS) 分配最低保證帶寬。

    存儲 - SSD、數據中心、數據管理

    AI 存儲解決方案必須快速適應 AI/ML 工作負載的擴展要求。應支持存儲容量和性能的可擴展性,而不會中斷正在進行的操作,并防止過度配置和利用不足。同時支持結構化和非結構化數據。存儲基礎設施的核心是 NVMe、SAS、CXL 等技術,它們與固態硬盤、旋轉介質和高帶寬內存元件一起使用。

    AI 和 Oakgate SSD 設備測試
    管理記憶和人工智能的頭部彩色圖像
    AI 頭部和 SAS 盒的彩色圖像

    人工智能和機器學習 (ML) 的出現只會增強對全面固態存儲設備 (SSD) 測試的迫切需求。由于人工智能工作負載的計算要求很高,預計人工智能將增加數據中心對 SSD 的需求。人工智能應用程序會生成和處理大量數據,因此需要具有高速數據訪問和處理能力的存儲解決方案。

    • 更快的數據訪問和處理速度:對于處理 AI 任務中使用的大型數據集和復雜算法至關重要。AI 應用程序通常涉及頻繁的讀寫操作,這使得 SSD 的性能和耐用性比傳統 HDD 更合適。這種需求可能會推動 SSD 技術和其他高性能存儲解決方案的創新。
    • 專業化和多樣化的工作量:可能會有專門針對 AI 應用需求的存儲解決方案的需求。這可能包括針對深度學習算法、實時分析或大規模數據處理優化的存儲系統。
    • 優化存儲系統:提高效率、可靠性和性能。這涉及使用機器學習算法來預測存儲使用模式、自動化數據分層或改進數據壓縮技術。

    Teledyne LeCroy OakGate 解決方案為新興的 CXL(Compute Express Link)內存設備提供測試功能,這些設備有望徹底改變數據中心,尤其是對于 AI 和機器學習工作負載。使用 CXL 的 AI 平臺需要 CPU 和 GPU、FPGA 和 TPU 等加速器之間進行高速、一致的內存訪問,CXL 內存設備將顯著提高數據傳輸速度、減少延遲并提高整體系統性能。

    • 功能和性能驗證測試:確保新的 CXL 設備投放市場時符合標準。
    • 質量和合規性測試:這意味著 AI 模型的訓練和推理時間更快,最終使數據中心的機器學習操作更加高效、強大。
    • 訓練和推理時間:在數據中心測試人工智能系統以實現更高效、更強大的機器學習操作,并增加不同處理單元之間的一致內存訪問,從而促進更復雜、更精密的人工智能算法和工作流程。

    測試串行連接 SCSI (SAS) 對于支持 AI 應用程序至關重要,尤其是在數據存儲和檢索方面。通過確保 SAS 系統經過全面測試并符合要求,AI 應用程序可以從可靠、高速且可擴展的數據存儲解決方案中受益,這對于有效的 AI 操作至關重要。

    • 高速數據傳輸:SAS 提供高速數據傳輸率,這對于需要快速訪問大型數據集的 AI 應用至關重要。這確保了 AI 模型能夠得到高效訓練和部署。
    • 可靠性和冗余:SAS 系統以其可靠性和冗余功能而聞名。這對于 AI 來說很重要,因為它可以確保數據始終可用并防止發生故障。
    • 可擴展性:SAS 支持可擴展存儲解決方案,允許 AI 系統擴展并處理不斷增加的數據量,而不會影響性能。
    • 兼容性:SAS 兼容各種存儲設備和接口,使其能夠靈活適用于不同的 AI 應用和環境。
    • 合規性測試:SAS 合規性測試可確保硬件符合性能和可靠性的行業標準。這對于維護依賴這些存儲解決方案的 AI 系統的完整性至關重要

    需要幫助或信息?

    我們隨時為您提供幫助,解答您的任何問題。我們期待您的回復