標籤: 史丹福研究人員提出了一個多代理強化學習框架以有效促進人工智慧溝通中的社會推理