logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微调DeepSeek-R1&构建RAG系统(篇三)

利用langchain把数据向量化保存到milvus中

文章图片
#语言模型#python
微调DeepSeek-R1&构建RAG系统(篇二)

使用modelscope的数据集,微调modelscope上的大模型(没使用Swift方法,在modelscope上已经有说明的很清楚了,这里就不再列举了,详见。,阿里的一款共享平台产品,里面也包含了一些模型库数据和数据集数据,可以结合modelscope的sdk直接使用,modelscope有完整的。在modelscope的notebook上完成操作后,如果要把调好的模型传输出来,可以使用mod

文章图片
#语言模型
微调DeepSeek-R1&构建RAG系统(篇一)

我们日常交流中的大模型,普遍指的是大语言模型(Large Language Model,简称LLM),但除了大语言模型外,还有其他的大模型。多模态大模型(同时处理文本、音频、视频等)比如:gpt-4o,可用于生成视频、生成图像等领域;视觉大模型(CV,专注视觉理解与生成)比如:ViT-22B,可用于辅助视觉感知,如智能驾驶自动感知周围环境科学计算大模型(解决科学领域的复杂计算问题),

文章图片
#语言模型#python
到底了