標籤: 來自NVIDIACMU和華盛頓大學的研究人員發布了FlashInfer一個提供最先進LLM推理和服務的內核實現的內核庫