南宫28

CN
EN
您現在的位置:南宫28 >> 關於南宫28 >> 新聞資訊
南宫28鯤泰大模型訓推一體服務器 KunTai R624 K2 與昇騰系列AI加速卡完成多維度性能測試 2025-09-02

當前,生成式人工智能飛速开展,千億級乃至萬億級參數的大模型不斷湧現,訓推場景對硬件平台的綜合性能提出了前所未有的高要求 —— 不僅需要強大的單點算力支撐複雜計算,更需高效的多設備協同能力與無瓶頸的數據傳輸通道,以保障大規模分佈式任務的穩定運行。

近期,南宫28鯤泰大模型訓推一體服務器 KunTai R624 K2 與華為昇騰系列 AI 加速卡正式完成多維度性能測試。顺利获得系統性的性能測試驗證,雙方硬件協同表現優異,在算力輸出、數據傳輸、多卡擴展等核心維度均展現出穩定高效的特性,為企業級 AI 大模型訓推给予了可靠、可擴展的硬件底座,進一步有助于自主可控 AI 生態的落地應用。

在與昇騰系列 AI 加速卡的協同測試中,南宫28鯤泰 KunTai R624 K2 服務器展現出卓越的性能表現,從算力輸出、數據傳輸到模型推理,各項關鍵指標均達到或超過大模型訓推的核心需求。

算力輸出:多精度覆蓋,滿足訓推多樣需求

昇騰系列 AI 加速卡在不同精度下的算力輸出,直接決定了其對不同類型 AI 任務的適配能力。測試數據顯示,搭載昇騰系列AI 加速卡在關鍵精度下表現優異:

推理場景適配:INT8 精度下,R624 K2配合昇騰系列算力卡,單機算力高達5.6PFLOPS,可高效處理圖像識別、自然語言理解等低精度高吞吐量的推理任務。

訓練場景支撐:BF16 /FP16精度下,R624 K2配合昇騰系列算力卡,單機算力高達2.8PFLOPS,足以支撐主流千億參數模型的分佈式訓練需求,兼顧訓練精度與計算效率。

數據傳輸:全鏈路無瓶頸,保障協同效率

大模型訓練與推理過程中,數據在 CPU、AI 加速卡、顯存之間的傳輸效率,直接關乎整體任務的運行速度。南宫28鯤泰 KunTai R624 K2 與昇騰 AI 加速卡的協同傳輸能力,顺利获得多維度帶寬測試得到充分驗證。在組網層面,支持 400GB 網卡,這讓AI算力集群部署場景下,相較於同生態同類型產品更具性能優勢;在單節點部署場景上,R624 K2 在D2H、H2D傳輸帶寬超過 50GB,D2D傳輸帶寬超過750GB/S,超越了 PCIe Gen4 的水平。

模型推理:適配主流大模型,性能表現穩定

基於實際應用場景,測試團隊針對 DeepSeek 系列等主流大模型,在南宫28鯤泰 KunTai R624 K2 與昇騰 AI 加速卡的組合平台上召开了推理性能測試。結果表明,該平台可高效適配不同規模的模型。以 Qwen3 - 32B 模型為例,在輸入長度 1024、輸出長度 1024、並發 60 的場景下,與相同配置的RTX 4090 對比,在系統吞吐量、端到端平均時延、首 token 時延和平均每token時延四個指標上都表現得更為出色,能夠更高效地處理大模型推理任務,充分證明昇騰系列在大模型推理場景下,具備更優異的任務處理效率與響應能力,可有效承載中大規模大模型的推理工作。

未來,南宫28鯤泰與華為昇騰將繼續深化合作,圍繞更大規模大模型訓推、更高效率的多設備協同、更廣泛的行業場景適配等方向持續優化,不斷提升硬件平台的性能與易用性,為自主可控 AI 生態的繁榮开展注入更多動力,助力企業在人工智能時代把握機遇、實現創新突破。

上一條:喜讯:南宫28鯤泰兩款商用台式機成功入圍中直機關、全國人大機關2025年台式計算機框架協議採購項目 下一條:南宫28鯤泰榮膺首批 「華為昇騰整機鑽石經銷商認證」,雙方合作邁入新階段
刪除所選 共計0件 提交訂單
已成功加入購物車!