logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM评测:以KIMI与qwen为例

我们通过kimi或者qwen官方文档,可以自己申请key并通过api调用对应的大模型,为了评测大模型,除了调用相应的框架,如:opencompass(我本地配完环境运行不出结果,并且发现有人跟我是同样问题,但是目前为止依旧没有解决),因此这里我以MMLU数据集为例,评测对应大模型的准确率。

文章图片
#nlp#python
到底了