logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GitHub 个人成品网站项目推荐(一键部署即可运营)

GitHub 个人成品网站项目推荐(一键部署即可运营)

#github
百度网盘资源下载慢解决方法(2025年)神速Down-油猴脚本

百度网盘资源下载慢解决方法(2025年)神速Down-油猴脚本

文章图片
油猴脚本百度网盘不限速(亲测有效)

油猴脚本百度网盘不限速(亲测有效)

文章图片
#学习#百度#经验分享 +2
小白简单本地部署 DeepSeek-R1 大模型

对于我们所有的模型,最大生成长度设置为 32,768 个 token。对于需要采样的基准,我们使用的温度为0.6,top-p 值为0.95,并为每个查询生成 64 个响应来估计 pass@1。DeepSeek-R1-Distill 模型基于开源模型进行了微调,使用了 DeepSeek-R1 生成的样本。我们对其配置和分词器进行了轻微更改。请使用我们的设置来运行这些模型。DeepSeek-R1-Ze

到底了