GeForce RTX 50 系列顯示卡驅動生成式人工智慧

NVIDIA的GeForce RTX 5090和5080顯示卡，基於創新的NVIDIA Blackwell架構，提供高達8倍的幀率速度，搭配NVIDIA DLSS 4技術，降低延遲的NVIDIA Reflex 2，以及增強圖形質感的NVIDIA RTX神經著色器。

這些顯示卡是為了加速最新的生成式人工智慧工作負載而設計的，每秒可達到3,352萬億次人工智慧運算（TOPS），為人工智慧愛好者、玩家、創作者和開發者帶來驚人的體驗。

為了幫助人工智慧開發者和愛好者利用這些能力，NVIDIA在上個月的CES展會上推出了NVIDIA NIM和AI藍圖（AI Blueprints）供RTX使用。NVIDIA NIM微服務是預先包裝的生成式人工智慧模型，讓開發者和愛好者能輕鬆開始使用生成式人工智慧，快速迭代，並利用RTX的力量在Windows電腦上加速人工智慧。NVIDIA AI藍圖則是參考項目，展示開發者如何使用NIM微服務來構建下一代的人工智慧體驗。

NIM和AI藍圖專為GeForce RTX 50系列顯示卡進行優化。這些技術無縫協作，幫助開發者和愛好者構建、迭代並提供尖端的人工智慧體驗。

NVIDIA NIM加速PC上的生成式人工智慧

雖然人工智慧模型的開發迅速進步，但將這些創新帶入PC仍然對許多人來說是一個挑戰。發布在Hugging Face等平台上的模型必須經過整理、調整和量化，才能在PC上運行。它們還需要整合到新的人工智慧應用程式介面（APIs）中，以確保與現有工具的兼容性，並轉換為優化的推理後端以達到最佳性能。

NVIDIA NIM微服務為RTX人工智慧PC和工作站簡化了這一過程，提供社群驅動和NVIDIA開發的人工智慧模型的訪問。這些微服務易於下載，並通過行業標準API連接，涵蓋了人工智慧PC所需的關鍵模式。它們還與各種人工智慧工具兼容，並提供靈活的部署選項，無論是在PC上、數據中心，還是在雲端。

NIM微服務包含在RTX顯示卡上運行優化模型所需的一切，包括針對特定顯示卡的預建引擎、NVIDIA TensorRT軟體開發工具包（SDK）、用於使用Tensor Cores進行加速推理的開源NVIDIA TensorRT-LLM庫等。

微軟和NVIDIA合作，使NIM微服務和AI藍圖能在Windows Linux子系統（WSL2）中使用。透過WSL2，運行在數據中心顯示卡上的相同人工智慧容器現在可以有效地在RTX PC上運行，使開發者能更輕鬆地在不同平台上構建、測試和部署人工智慧模型。

此外，NIM和AI藍圖利用了GeForce RTX 50系列所基於的Blackwell架構的關鍵創新，包括第五代Tensor Cores和對FP4精度的支持。

Tensor Cores驅動下一代人工智慧性能

人工智慧計算需求極高，需要大量的處理能力。無論是生成圖像和視頻，還是理解語言和做出即時決策，人工智慧模型每秒需要完成數百兆的數學運算。為了跟上這一需求，電腦需要專門為人工智慧設計的硬體。

NVIDIA GeForce RTX桌面顯示卡提供高達3,352 AI TOPS，實現無與倫比的速度和效率，適用於人工智慧工作流程。

在2018年，NVIDIA GeForce RTX顯示卡改變了遊戲規則，引入了Tensor Cores——專門設計用來處理這些高強度工作負載的人工智慧處理器。與傳統計算核心不同，Tensor Cores旨在通過更快和更高效地執行計算來加速人工智慧。這一突破幫助將人工智慧驅動的遊戲、創意工具和生產力應用推向主流。

Blackwell架構將人工智慧加速提升到新的高度。Blackwell顯示卡中的第五代Tensor Cores提供高達3,352 AI TOPS，以處理更具挑戰性的人工智慧任務，並同時運行多個人工智慧模型。這意味著更快的人工智慧驅動體驗，從即時渲染到智能助手，為遊戲、內容創作等領域帶來更大的創新。

FP4——更小的模型，更大的性能

優化人工智慧性能的另一種方法是量化，這是一種減少模型大小的技術，使模型能更快運行，同時減少內存需求。

這就是FP4——一種先進的量化格式，允許人工智慧模型在不妥協輸出質量的情況下更快、更輕巧地運行。與FP16相比，它可將模型大小減少高達60%，並且性能提高超過一倍，幾乎不影響質量。

例如，Black Forest Labs的FLUX.1 [dev]模型在FP16下需要超過23GB的顯示記憶體（VRAM），這意味著只有GeForce RTX 4090和專業顯示卡能支持。使用FP4後，FLUX.1 [dev]只需不到10GB，因此可以在更多GeForce RTX顯示卡上本地運行。

在GeForce RTX 4090上，使用FP16的FLUX.1 [dev]模型可以在15秒內生成圖像，只需30步驟。而使用FP4的GeForce RTX 5090，圖像生成時間僅需五秒多一點。

FP4是Blackwell架構的原生支持，使在本地PC上部署高性能人工智慧變得比以往更容易。它還集成在NIM微服務中，有效優化了之前難以量化的模型。通過實現更高效的人工智慧處理，FP4幫助帶來更快、更智能的內容創作人工智慧體驗。

AI藍圖為RTX PC提供先進的人工智慧工作流程

NVIDIA AI藍圖基於NIM微服務，提供預包裝的優化參考實現，使開發先進的人工智慧項目變得更容易——無論是數位人類、播客生成器還是應用助手。

在CES上，NVIDIA展示了PDF轉播客的藍圖，允許用戶將PDF轉換為有趣的播客，並在之後與AI播客主持人進行問答。這一工作流程整合了七個不同的人工智慧模型，協同工作以提供動態的互動體驗。

PDF轉播客的藍圖利用多個人工智慧模型，無縫地將PDF轉換為引人入勝的播客，並包含由AI驅動的播客主持人的互動問答功能。

透過AI藍圖，用戶可以快速從實驗轉向在RTX PC和工作站上開發人工智慧。

NIM和AI藍圖即將在RTX PC和工作站上推出

生成式人工智慧正在推動遊戲、內容創作等領域的可能性邊界。透過NIM微服務和AI藍圖，最新的人工智慧進展不再僅限於雲端——它們現在已經為RTX PC進行了優化。使用RTX顯示卡，開發者和愛好者可以在本地PC和工作站上實驗、構建和部署人工智慧。

NIM微服務和AI藍圖即將推出，最初支持GeForce RTX 50系列、GeForce RTX 4090和4080，以及NVIDIA RTX 6000和5000專業顯示卡。未來將支持更多顯示卡。

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

GeForce RTX 50 系列顯示卡驅動生成式人工智慧

自動化直通的WAGO接頭

2.0 Flash Flash-Lite Pro Experimental

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2027 年 AI 預測人類水平 AI 的全新里程碑

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

AI 技術對人類智能的影響我們在失去什麼？

人工智慧重塑遊戲開發遊戲未來從現在開始

2.0 Flash Flash-Lite Pro Experimental

LinkedIn 正在測試一個可能改變人們求職方式的 AI 工具

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

GeForce RTX 50 系列顯示卡驅動生成式人工智慧

NVIDIA NIM加速PC上的生成式人工智慧

Tensor Cores驅動下一代人工智慧性能

FP4——更小的模型，更大的性能

AI藍圖為RTX PC提供先進的人工智慧工作流程

NIM和AI藍圖即將在RTX PC和工作站上推出

自動化直通的WAGO接頭

2.0 Flash Flash-Lite Pro Experimental

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆