揭示 NIM 微服務與 AI 藍圖

在過去的一年中，生成式人工智慧（AI）改變了人們的生活、工作和娛樂方式，提升了寫作、內容創作、遊戲、學習和生產力等各方面的體驗。電腦愛好者和開發者正在推動這項突破性技術的邊界。

許多行業定義的技術突破都是在一個地方誕生的——車庫。本週標誌著 RTX AI Garage 系列的開始，這將為開發者和愛好者提供定期的內容，幫助他們了解 NVIDIA NIM 微服務和 AI 藍圖，以及如何在 AI 電腦上建立 AI 代理、創意工作流程、數位人類、生產力應用等。歡迎來到 RTX AI Garage。

這第一期重點介紹了本週在 CES 上發布的公告，包括在 NVIDIA RTX AI 電腦上可用的新 AI 基礎模型，這些模型將數位人類、內容創作、生產力和開發提升到新的水平。

這些模型——作為 NVIDIA NIM 微服務提供——由新的 GeForce RTX 50 系列 GPU 驅動。基於 NVIDIA Blackwell 架構，RTX 50 系列 GPU 每秒可執行高達 3,352 兆次的 AI 操作，擁有 32GB 的 VRAM，並具備 FP4 計算，將 AI 推理性能翻倍，並使生成式 AI 能夠在本地運行，佔用更少的記憶體。

NVIDIA 還推出了 NVIDIA AI 藍圖——這些是現成的、預配置的工作流程，基於 NIM 微服務，適用於數位人類和內容創作等應用。

NIM 微服務和 AI 藍圖使愛好者和開發者能夠更快地構建、迭代和交付 AI 驅動的體驗。結果是為 PC 用戶帶來了一波新的引人入勝的實用功能。

快速推進 AI 與 NVIDIA NIM

將 AI 進步帶入 PC 有兩個主要挑戰。首先，AI 研究的速度非常快，每天在 Hugging Face 等平台上都有新模型出現，現在已經有超過一百萬個模型。因此，突破性進展很快就會過時。

其次，將這些模型調整為 PC 使用是一個複雜且資源密集的過程。為 PC 硬體優化它們、將它們與 AI 軟體整合並連接到應用程式需要大量的工程努力。

NVIDIA NIM 幫助解決這些挑戰，提供預包裝的、針對 PC 優化的最先進 AI 模型。這些 NIM 微服務涵蓋多個模型領域，可以一鍵安裝，具備應用程式編程介面（API）以便於整合，並利用 NVIDIA AI 軟體和 RTX GPU 提供加速性能。

在 CES 上，NVIDIA 宣布了一系列針對 RTX AI 電腦的 NIM 微服務，支持包括大型語言模型（LLMs）、視覺語言模型、圖像生成、語音、檢索增強生成（RAG）、PDF 提取和計算機視覺等應用場景。

新的 Llama Nemotron 開放模型系列在各種代理任務上提供高準確性。Llama Nemotron Nano 模型將作為 NIM 微服務提供給 RTX AI 電腦和工作站，擅長於指令跟隨、功能調用、聊天、編碼和數學等代理 AI 任務。

不久，開發者將能夠快速下載並在 Windows 11 PC 上使用 Windows Subsystem for Linux (WSL) 運行這些微服務。

為了展示愛好者和開發者如何使用 NIM 構建 AI 代理和助手，NVIDIA 預覽了 Project R2X，這是一個具備視覺功能的 PC 虛擬形象，可以將資訊放在用戶的指尖，協助桌面應用程式和視頻會議，閱讀和總結文件等等。請註冊以獲取 Project R2X 的更新。

通過使用 NIM 微服務，AI 愛好者可以跳過模型策劃、優化和後端整合的複雜性，專注於創造和創新最前沿的 AI 模型。

API 的內容是什麼？

API 是應用程式與軟體庫之間溝通的方式。API 定義了一組應用程式可以對庫進行的“調用”，以及應用程式可以期待的回應。傳統的 AI API 需要大量的設置和配置，使得 AI 功能變得難以使用，並妨礙創新。

NIM 微服務提供易於使用、直觀的 API，應用程式可以簡單地發送請求並獲得回應。此外，它們是根據不同模型類型的輸入和輸出媒體設計的。例如，LLMs 接受文本作為輸入並生成文本作為輸出，圖像生成器將文本轉換為圖像，語音識別器將語音轉換為文本，等等。

這些微服務旨在與領先的 AI 開發和代理框架無縫整合，如 VSCode 的 AI Toolkit、AnythingLLM、ComfyUI、Flowise AI、LangChain、Langflow 和 LM Studio。開發者可以輕鬆從 build.nvidia.com 下載和部署它們。

通過將這些 API 引入 RTX，NVIDIA NIM 將加速 PC 上的 AI 創新。

預計愛好者將能夠在即將推出的 NVIDIA ChatRTX 技術演示中體驗一系列 NIM 微服務。

創新的藍圖

通過使用最先進的模型，這些模型已預包裝並針對 PC 優化，開發者和愛好者可以快速創建 AI 驅動的項目。更進一步，他們可以結合多個 AI 模型和其他功能，構建複雜的應用程式，如數位人類、播客生成器和應用助手。

NVIDIA AI 藍圖，基於 NIM 微服務，是複雜 AI 工作流程的參考實現。它們幫助開發者將多個組件（包括庫、軟體開發工具包和 AI 模型）連接在一起，形成一個單一的應用程式。

AI 藍圖包括開發者構建、運行、自定義和擴展參考工作流程所需的一切，這包括參考應用程式和源代碼、示例數據，以及自定義和協調不同組件的文檔。

在 CES 上，NVIDIA 宣布了兩個針對 RTX 的 AI 藍圖：一個是 PDF 轉播客，讓用戶可以從任何 PDF 生成播客；另一個是基於 FLUX.1 [dev] 的 3D 引導生成式 AI，預計將作為 NIM 微服務提供，為藝術家提供更大的文本圖像生成控制。

通過 AI 藍圖，開發者可以快速從 AI 實驗轉向 RTX 電腦和工作站上的 AI 開發，實現最前沿的工作流程。

為生成式 AI 而生

新的 GeForce RTX 50 系列 GPU 專門設計用來解決複雜的生成式 AI 挑戰，具備第五代 Tensor 核心和 FP4 支持、更快的 G7 記憶體，以及一個 AI 管理處理器，以有效地在 AI 和創意工作流程之間進行多任務處理。

GeForce RTX 50 系列增加了 FP4 支持，以幫助為 PC 帶來更好的性能和更多模型。FP4 是一種較低的量化方法，類似於文件壓縮，減少模型大小。與 FP16（大多數模型的默認方法）相比，FP4 使用的記憶體少於一半，50 系列 GPU 的性能比上一代提高了兩倍以上。這幾乎不會損失質量，因為 NVIDIA TensorRT 模型優化器提供了先進的量化方法。

例如，Black Forest Labs 的 FLUX.1 [dev] 模型在 FP16 下需要超過 23GB 的 VRAM，這意味著只有 GeForce RTX 4090 和專業 GPU 才能支持。使用 FP4，FLUX.1 [dev] 需要的 VRAM 少於 10GB，因此可以在更多 GeForce RTX GPU 上本地運行。

使用 GeForce RTX 4090 和 FP16，FLUX.1 [dev] 模型可以在 30 步驟內生成圖像，耗時 15 秒。使用 GeForce RTX 5090 和 FP4，圖像生成時間僅需五秒多一點。

開始使用新的 PC AI API

NVIDIA NIM 微服務和 AI 藍圖預計將於下個月推出，初步支持 GeForce RTX 50 系列、GeForce RTX 4090 和 4080，以及 NVIDIA RTX 6000 和 5000 專業 GPU。未來將支持更多 GPU。

NIM 準備好的 RTX AI 電腦預計將由 Acer、ASUS、Dell、GIGABYTE、HP、Lenovo、MSI、Razer 和 Samsung 等品牌提供，還有當地系統建設商 Corsair、Falcon Northwest、LDLC、Maingear、Mifcon、Origin PC、PCS 和 Scan。

GeForce RTX 50 系列 GPU 和筆記型電腦提供改變遊戲規則的性能，推動變革性的 AI 體驗，並使創作者能夠在創作流程中以創紀錄的速度完成工作。重溫 NVIDIA 執行長黃仁勳在 CES 上發表的主題演講，以了解更多 NVIDIA 在 AI 領域的新消息。

請參閱有關軟體產品資訊的通知。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！