logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM benchmark简介

综合性的中文评估基准,专门用于评估语言在中文语境下的知识和推理能力。CMMLM涵盖了从基础学科到高级专业水平的67个主题,比如:需要计算和推理的自然学科、需要知识的人文科学和社会学科以及需要生活常识的中国驾驶规则等,包括在其他地区或语言中并不适用的中国特定答案。全面的中文基础模型评估套件,涵盖了52个不同学科的13948个多项选择题,分为4个难度级别。由人类问题作者创建的8.5K高质量多样化小学数

#AIGC
DataHub安装及测试

DataHub安装及测试

#大数据
到底了