標籤: MedHELM一個綜合醫療基準用於評估語言模型在真實電子健康紀錄中的臨床任務表現