
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
如何利用DeepSeek训练自己的模型
数据集是训练模型的基础材料,我们可以根据自己的需求收集相关数据,每个行业业务不同,针对具体的业务场景进行收集。数据的清洗与标注是关键。DeepSeek提供了数据预处理工具,可以帮助快速的完成数据整理。
DeepSeek的满血版与蒸馏版
目前市面上主流的成本最低的部署大模型的方法就是通过Ollama本地大模型运行框架,专门为本地机器上运行和部署大模型设计的。蒸馏版:通过技术从满血版提取关键知识,缩小模型体积,降低硬件需求,参数量从1.5B 到70B不等。满血版:参数量大,性能强,但需要极高的硬件配置(如1T内存、双H100 80G显卡)满血版DeepSeek-R1的参数量6710亿参数,对设备配置要求高。参数量(如1.5B):模型
如何利用DeepSeek训练自己的模型
数据集是训练模型的基础材料,我们可以根据自己的需求收集相关数据,每个行业业务不同,针对具体的业务场景进行收集。数据的清洗与标注是关键。DeepSeek提供了数据预处理工具,可以帮助快速的完成数据整理。
到底了







