DeepSeek AI 發布 DualPipe:一種用於 V3/R1 訓練的雙向管道並行算法,以實現計算-通信重疊 by AI 台灣 2025-02-28 0 訓練深度神經網絡,尤其是那些擁有數十億參 ...
DeepSeek AI 發布 DeepGEMM:一個支持密集和 MoE GEMM 的 FP8 GEMM 庫,為 V3/R1 訓練和推理提供動力 by AI 台灣 2025-02-26 0 有效的矩陣乘法在現代深度學習和高效能計算 ...