NVIDIA的GeForce RTX 5090和5080顯示卡,基於創新的NVIDIA Blackwell架構,提供高達8倍的幀率速度,搭配NVIDIA DLSS 4技術,降低延遲的NVIDIA Reflex 2,以及增強圖形質感的NVIDIA RTX神經著色器。
這些顯示卡是為了加速最新的生成式人工智慧工作負載而設計的,每秒可達到3,352萬億次人工智慧運算(TOPS),為人工智慧愛好者、玩家、創作者和開發者帶來驚人的體驗。
為了幫助人工智慧開發者和愛好者利用這些能力,NVIDIA在上個月的CES展會上推出了NVIDIA NIM和AI藍圖(AI Blueprints)供RTX使用。NVIDIA NIM微服務是預先包裝的生成式人工智慧模型,讓開發者和愛好者能輕鬆開始使用生成式人工智慧,快速迭代,並利用RTX的力量在Windows電腦上加速人工智慧。NVIDIA AI藍圖則是參考項目,展示開發者如何使用NIM微服務來構建下一代的人工智慧體驗。
NIM和AI藍圖專為GeForce RTX 50系列顯示卡進行優化。這些技術無縫協作,幫助開發者和愛好者構建、迭代並提供尖端的人工智慧體驗。
NVIDIA NIM加速PC上的生成式人工智慧
雖然人工智慧模型的開發迅速進步,但將這些創新帶入PC仍然對許多人來說是一個挑戰。發布在Hugging Face等平台上的模型必須經過整理、調整和量化,才能在PC上運行。它們還需要整合到新的人工智慧應用程式介面(APIs)中,以確保與現有工具的兼容性,並轉換為優化的推理後端以達到最佳性能。
NVIDIA NIM微服務為RTX人工智慧PC和工作站簡化了這一過程,提供社群驅動和NVIDIA開發的人工智慧模型的訪問。這些微服務易於下載,並通過行業標準API連接,涵蓋了人工智慧PC所需的關鍵模式。它們還與各種人工智慧工具兼容,並提供靈活的部署選項,無論是在PC上、數據中心,還是在雲端。
NIM微服務包含在RTX顯示卡上運行優化模型所需的一切,包括針對特定顯示卡的預建引擎、NVIDIA TensorRT軟體開發工具包(SDK)、用於使用Tensor Cores進行加速推理的開源NVIDIA TensorRT-LLM庫等。
微軟和NVIDIA合作,使NIM微服務和AI藍圖能在Windows Linux子系統(WSL2)中使用。透過WSL2,運行在數據中心顯示卡上的相同人工智慧容器現在可以有效地在RTX PC上運行,使開發者能更輕鬆地在不同平台上構建、測試和部署人工智慧模型。
此外,NIM和AI藍圖利用了GeForce RTX 50系列所基於的Blackwell架構的關鍵創新,包括第五代Tensor Cores和對FP4精度的支持。
Tensor Cores驅動下一代人工智慧性能
人工智慧計算需求極高,需要大量的處理能力。無論是生成圖像和視頻,還是理解語言和做出即時決策,人工智慧模型每秒需要完成數百兆的數學運算。為了跟上這一需求,電腦需要專門為人工智慧設計的硬體。
在2018年,NVIDIA GeForce RTX顯示卡改變了遊戲規則,引入了Tensor Cores——專門設計用來處理這些高強度工作負載的人工智慧處理器。與傳統計算核心不同,Tensor Cores旨在通過更快和更高效地執行計算來加速人工智慧。這一突破幫助將人工智慧驅動的遊戲、創意工具和生產力應用推向主流。
Blackwell架構將人工智慧加速提升到新的高度。Blackwell顯示卡中的第五代Tensor Cores提供高達3,352 AI TOPS,以處理更具挑戰性的人工智慧任務,並同時運行多個人工智慧模型。這意味著更快的人工智慧驅動體驗,從即時渲染到智能助手,為遊戲、內容創作等領域帶來更大的創新。
FP4——更小的模型,更大的性能
優化人工智慧性能的另一種方法是量化,這是一種減少模型大小的技術,使模型能更快運行,同時減少內存需求。
這就是FP4——一種先進的量化格式,允許人工智慧模型在不妥協輸出質量的情況下更快、更輕巧地運行。與FP16相比,它可將模型大小減少高達60%,並且性能提高超過一倍,幾乎不影響質量。
例如,Black Forest Labs的FLUX.1 [dev]模型在FP16下需要超過23GB的顯示記憶體(VRAM),這意味著只有GeForce RTX 4090和專業顯示卡能支持。使用FP4後,FLUX.1 [dev]只需不到10GB,因此可以在更多GeForce RTX顯示卡上本地運行。
在GeForce RTX 4090上,使用FP16的FLUX.1 [dev]模型可以在15秒內生成圖像,只需30步驟。而使用FP4的GeForce RTX 5090,圖像生成時間僅需五秒多一點。
FP4是Blackwell架構的原生支持,使在本地PC上部署高性能人工智慧變得比以往更容易。它還集成在NIM微服務中,有效優化了之前難以量化的模型。通過實現更高效的人工智慧處理,FP4幫助帶來更快、更智能的內容創作人工智慧體驗。
AI藍圖為RTX PC提供先進的人工智慧工作流程
NVIDIA AI藍圖基於NIM微服務,提供預包裝的優化參考實現,使開發先進的人工智慧項目變得更容易——無論是數位人類、播客生成器還是應用助手。
在CES上,NVIDIA展示了PDF轉播客的藍圖,允許用戶將PDF轉換為有趣的播客,並在之後與AI播客主持人進行問答。這一工作流程整合了七個不同的人工智慧模型,協同工作以提供動態的互動體驗。

透過AI藍圖,用戶可以快速從實驗轉向在RTX PC和工作站上開發人工智慧。
NIM和AI藍圖即將在RTX PC和工作站上推出
生成式人工智慧正在推動遊戲、內容創作等領域的可能性邊界。透過NIM微服務和AI藍圖,最新的人工智慧進展不再僅限於雲端——它們現在已經為RTX PC進行了優化。使用RTX顯示卡,開發者和愛好者可以在本地PC和工作站上實驗、構建和部署人工智慧。
NIM微服務和AI藍圖即將推出,最初支持GeForce RTX 50系列、GeForce RTX 4090和4080,以及NVIDIA RTX 6000和5000專業顯示卡。未來將支持更多顯示卡。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!