標籤: 將多模態大型語言模型與行動結合