MiniMax-Text-01 和 MiniMax-VL-01 發佈:可擴展模型,具備閃電注意力、456B 參數、4M 令牌上下文及最先進的準確性 by AI 台灣 2025-01-16 0 大型語言模型(LLMs)和視覺語言模型( ...
阿里巴巴 Qwen 團隊剛發布《數學推理中開發過程獎勵模型的課程》,以及最先進的 7B 和 72B PRMs by AI 台灣 2025-01-15 0 數學推理一直是大型語言模型 (LLMs) ...
實作交付路線優化(TSP)與 AI,使用 LKH 和 Python | 皮耶羅·派亞隆加 | 2025 年 1 月 by AI 台灣 2025-01-15 0 這篇文章的代碼可以在這個 GitHub ...
如何使用 Visual Studio Code 和 IAM Access Analyzer 實施 IAM 政策檢查 by AI 台灣 2025-01-15 0 在之前的部落格文章中,我們介紹了 IAM ...
加州大學伯克利分校研究人員發布 Sky-T1-32B-Preview:一個開源推理 LLM,訓練成本低於 450 美元,在 Math500、AIME 和 Livebench 等基準上超越 OpenAI-o1 by AI 台灣 2025-01-14 0 人工智慧的快速進步帶來了新的可能性,但相 ...
理解 ChatGPT 的演變:第二部分 — GPT-2 和 GPT-3 | 作者:Shirley Li | 2025年1月 by AI 台灣 2025-01-13 0 繞過微調的範式轉變在我們之前的文章中,我 ...
Google AI 剛剛在 Hugging Face 上發布了 TimesFM-2.0(JAX 和 Pytorch),顯著提高了準確性和最大上下文長度 by AI 台灣 2025-01-11 0 時間序列預測在金融、醫療和氣候科學等各個 ...