雷湘剑个人主页

@dreambeibei

雷湘剑

2024-01-17 09:56:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

如何利用DeepSeek训练自己的模型

数据集是训练模型的基础材料，我们可以根据自己的需求收集相关数据，每个行业业务不同，针对具体的业务场景进行收集。数据的清洗与标注是关键。DeepSeek提供了数据预处理工具，可以帮助快速的完成数据整理。

#人工智能

DeepSeek的满血版与蒸馏版

目前市面上主流的成本最低的部署大模型的方法就是通过Ollama本地大模型运行框架，专门为本地机器上运行和部署大模型设计的。蒸馏版：通过技术从满血版提取关键知识，缩小模型体积，降低硬件需求，参数量从1.5B 到70B不等。满血版：参数量大，性能强，但需要极高的硬件配置（如1T内存、双H100 80G显卡）满血版DeepSeek-R1的参数量6710亿参数，对设备配置要求高。参数量（如1.5B)：模型

#人工智能

如何利用DeepSeek训练自己的模型

#人工智能

到底了