亚洲国产精品一区二区三区久久-亚洲国产精品一区二区首页-亚洲国产精品影院-亚洲国产精品张柏芝在线观看-日本不卡高清免费v-日本不卡免费高清一级视频

FlagEval
免費測試
Ai平臺模型

FlagEval

FlagEval(天秤)由智源研究院將聯合多個高校團隊打造,是一種采用“能力—任務—指標”三維評測框架的大模型評測平臺,旨在提供全面、細致的評測結果。

標簽:

FlagEval(天秤)由智源研究院將聯合多個高校團隊打造,是一種采用“能力—任務—指標”三維評測框架的大模型評測平臺,旨在提供全面、細致的評測結果。該平臺已提供了 30 多種能力、5 種任務和 4 大類指標,共 600 多個維度的全面評測,任務維度包括 22 個主客觀評測數據集和 84433 道題目。

相關網站