新浪科技讯 6月9日上午新闻 ,天秤2023北京智源大会上 ,智源钻研智源钻研院院长黄铁军宣告推出FlagEval (天秤)狂语言模子评测系统,院宣力争从“能耐、告推盖余使命、出大测系目的模评”三维评测角度 ,600多个维度对于大模子妨碍周全测评,统涵建树迷信 、评估公平 、维度周全的天秤大模子技术评估系统
新浪科技讯 6月9日上午新闻 ,天秤2023北京智源大会上 ,智源钻研智源钻研院院长黄铁军宣告推出FlagEval (天秤)狂语言模子评测系统,院宣力争从“能耐、告推盖余使命、出大测系目的模评”三维评测角度 ,600多个维度对于大模子妨碍周全测评,统涵建树迷信 、评估公平 、维度周全的天秤大模子技术评估系统