logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何利用DeepSeek训练自己的模型

数据集是训练模型的基础材料,我们可以根据自己的需求收集相关数据,每个行业业务不同,针对具体的业务场景进行收集。数据的清洗与标注是关键。DeepSeek提供了数据预处理工具,可以帮助快速的完成数据整理。

#人工智能
DeepSeek的满血版与蒸馏版

目前市面上主流的成本最低的部署大模型的方法就是通过Ollama本地大模型运行框架,专门为本地机器上运行和部署大模型设计的。蒸馏版:通过技术从满血版提取关键知识,缩小模型体积,降低硬件需求,参数量从1.5B 到70B不等。满血版:参数量大,性能强,但需要极高的硬件配置(如1T内存、双H100 80G显卡)满血版DeepSeek-R1的参数量6710亿参数,对设备配置要求高。参数量(如1.5B):模型

#人工智能
如何利用DeepSeek训练自己的模型

数据集是训练模型的基础材料,我们可以根据自己的需求收集相关数据,每个行业业务不同,针对具体的业务场景进行收集。数据的清洗与标注是关键。DeepSeek提供了数据预处理工具,可以帮助快速的完成数据整理。

#人工智能
到底了