
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文记录了使用 LLaMA-Factory 微调一个 DeepSeek 1.5B 的蒸馏模型的全过程,包括软件下载、插件按照、自定义数据集等过程。

本文探索了DeepSeek 大模型的 API 的使用,记录了从申请到充值到调用的全流程,调用部分包括了基础的多轮对话和流式输出的例程。

本文记录了安装 Ollama 下载 DeepSeek模型,使用 Python 代码对 Ollama 下载的模型进行调用和推理的全过程,简单易懂,全程无痛。

本文记录了使用 LLaMA-Factory 微调一个 DeepSeek 1.5B 的蒸馏模型的全过程,包括软件下载、插件按照、自定义数据集等过程。

通义千问是阿里云开发的大语言模型(Large language Model )LLM,旨在提供广泛的知识和普适性,可以理解和回答各领域中的问题,其包含网页版和手机版本的通义前文APP,网页使用的模型为不公开的最新版本。在其官方文档中主要开源了五种可以使用的模型其开源模型的简介和参数如下:非限时免费开发模型,有使用Token数量的限制。

本文记录了SCI收录的与人工智能有关的144个SCI期刊论文,并对影响力较高的50期刊进行了简要分析,包括分区,影响因子,主要收录方向,以及提供了这50个期刊的网址。

通义千问是阿里云开发的大语言模型(Large language Model )LLM,旨在提供广泛的知识和普适性,可以理解和回答各领域中的问题,其包含网页版和手机版本的通义前文APP,网页使用的模型为不公开的最新版本。在其官方文档中主要开源了五种可以使用的模型其开源模型的简介和参数如下:非限时免费开发模型,有使用Token数量的限制。

机器学习-深度学习跨语言的部署是通过将主要由python实现的机器学习和深度度学习模型应用于实际的环境中,具体为部署在,手机,网页,PC等各类设备上。主要通过将模型保存成一种格式的文件,然后通过推理引擎进行读取。机器学习 Machine Learning:机器学习包括深度学习,但是在研究中,机器学习方法主要代指,SVM,KNN,聚类,决策树,随机森林,等传统机器学习方法。深度学习 Deep Lea

本文主要是面对小白入门一下如何非常简单的使用flask框架发布一个服务,设置基础的端口号允许访问的地址,还有用python代码访问自己发布发服务获取结果。

在完成了GPT多轮对话流式输出和知识向量库之后,接下来就非常重要的对模型进行微调,相比于我了解到的国内的大模型的微调,一般都需要在Linux服务器上使用shell文件进行微调,而OpenAI对GPT模型开放了线上微调的功能,只需要直接上传你的json文件选择一个与训练模型,就可以一键微调,之后也是在PC端直接应用你微调的模型就好,对于学习了解微调来说,这是一个最快的入门方式。








