潛能揭示水星：首個商業規模擴散大型語言模型

生成式人工智慧和大型語言模型 (LLMs) 的領域因為創新初創公司 Inception Labs 推出的 Mercury 而取得了顯著的進展。這是第一個商業規模的擴散大型語言模型 (dLLMs)，Inception Labs 承諾在文本和程式碼生成任務的速度、成本效益和智能方面帶來根本性的變革。

Mercury：設定人工智慧速度和效率的新標準

Inception 的 Mercury 系列擴散大型語言模型提供了前所未有的性能，運行速度超過傳統 LLM 架構所能達到的。Mercury 在普通的 NVIDIA H100 GPU 上實現了超過每秒 1000 個標記的驚人吞吐量，這種性能曾經只有專門設計的硬體如 Groq、Cerebras 和 SambaNova 才能實現。這意味著與目前領先的自回歸模型相比，速度提升了驚人的 5-10 倍。

擴散模型：文本生成的未來

傳統的自回歸 LLM 逐個標記生成文本，這會導致顯著的延遲和計算成本，特別是在需要大量推理和錯誤修正的任務中。然而，擴散模型利用獨特的「粗到細」生成過程。與受限於順序生成的自回歸模型不同，擴散模型通過從嘈雜的近似值中逐步精煉輸出，實現了多個標記的並行更新。這種方法顯著提高了推理、錯誤修正和生成內容的整體一致性。

雖然擴散方法在圖像、音頻和視頻生成方面已經證明是革命性的，推動了像 Midjourney 和 Sora 這樣的應用，但在文本和程式碼等離散數據領域的應用直到 Inception 的突破之前大多數還未被探索。

Mercury Coder：高速、高品質的程式碼生成

Inception 的旗艦產品 Mercury Coder 專門針對程式碼應用進行了優化。開發者現在可以使用一個高品質、快速響應的模型，能夠以每秒超過 1000 個標記的速度生成程式碼，這比現有的速度導向模型有了顯著的改善。

在標準的程式碼基準測試中，Mercury Coder 不僅匹配，還經常超越其他高性能模型，如 GPT-4o Mini 和 Claude 3.5 Haiku。此外，Mercury Coder Mini 在 Copilot Arena 獲得了第二名的好成績，超越了 GPT-4o Mini 和 Gemini-1.5-Flash 等成熟模型。更令人印象深刻的是，Mercury 在速度上比 GPT-4o Mini 快了約 4 倍。