超聚變FusionOne AI以精益成本、性能躍升的雙重突破,大幅降低DeepSeek-R1 671B模型的部署門檻,以普惠形態讓更多企業和科研機構能夠輕松應用。未來,超聚變將持續加大研發投入,聚焦AI算力優化與應用拓展,加速企業AI應用落地。
usionOne AI三大亮點,打破行業質疑:誰說96GB H20單機跑不了滿血版?
亮點1:精益成本
? 無需額外服務器,1臺FusionServer G8600,8張H20卡即可運行原生滿血模型(DeepSeek-R1 671B FP8精度);
? 顯存使用量降低30%:從原本141GB H20降低為96GB。
亮點2:良好性能
? 通過對推理引擎的深度優化和KV Cache策略的優化,單臺G8600 H20(768GB)跑滿血大模型,性能提升50%,實現32個并發訪問;吞吐量可至1000 token/s。
亮點3:靈活部署
? 通過易用的容器管理平臺,靈活選擇部署DeepSeek全系列模型以及多種AI加速卡,快速滿足不同AI應用場景。
微信號:13750856549