logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

初探—使用 LLaMA-Factory+AutoDL 0代码有监督微调 DeepSeek1.5B 流程笔记

本文记录了使用 LLaMA-Factory 微调一个 DeepSeek 1.5B 的蒸馏模型的全过程,包括软件下载、插件按照、自定义数据集等过程。

文章图片
#自然语言处理
Windows DeepSeek API调用基础教程-Python

本文探索了DeepSeek 大模型的 API 的使用,记录了从申请到充值到调用的全流程,调用部分包括了基础的多轮对话和流式输出的例程。

文章图片
#python#人工智能#语言模型 +1
使用 Python 调用 Ollama 部署到本地的 DeepSeek 模型 Windows 全流程记录笔记

本文记录了安装 Ollama 下载 DeepSeek模型,使用 Python 代码对 Ollama 下载的模型进行调用和推理的全过程,简单易懂,全程无痛。

文章图片
#python#windows
初探—使用 LLaMA-Factory+AutoDL 0代码有监督微调 DeepSeek1.5B 流程笔记

本文记录了使用 LLaMA-Factory 微调一个 DeepSeek 1.5B 的蒸馏模型的全过程,包括软件下载、插件按照、自定义数据集等过程。

文章图片
#自然语言处理
调用阿里通义千问大语言模型API-小白新手教程-python

​通义千问是阿里云开发的大语言模型(Large language Model )LLM,旨在提供广泛的知识和普适性,可以理解和回答各领域中的问题,其包含网页版和手机版本的通义前文APP,网页使用的模型为不公开的最新版本。​在其官方文档中主要开源了五种可以使用的模型其开源模型的简介和参数如下:​非限时免费开发模型,有使用Token数量的限制。

文章图片
#语言模型#人工智能#自然语言处理
人工智能相关SCI期刊笔记—影响因子、中科院/JCR 分区 、收录方向

本文记录了SCI收录的与人工智能有关的144个SCI期刊论文,并对影响力较高的50期刊进行了简要分析,包括分区,影响因子,主要收录方向,以及提供了这50个期刊的网址。

文章图片
#人工智能
调用阿里通义千问大语言模型API-小白新手教程-python

​通义千问是阿里云开发的大语言模型(Large language Model )LLM,旨在提供广泛的知识和普适性,可以理解和回答各领域中的问题,其包含网页版和手机版本的通义前文APP,网页使用的模型为不公开的最新版本。​在其官方文档中主要开源了五种可以使用的模型其开源模型的简介和参数如下:​非限时免费开发模型,有使用Token数量的限制。

文章图片
#语言模型#人工智能#自然语言处理
深度学习或机器学习的模型部署相关的初步了解及分析

机器学习-深度学习跨语言的部署是通过将主要由python实现的机器学习和深度度学习模型应用于实际的环境中,具体为部署在,手机,网页,PC等各类设备上。主要通过将模型保存成一种格式的文件,然后通过推理引擎进行读取。机器学习 Machine Learning:机器学习包括深度学习,但是在研究中,机器学习方法主要代指,SVM,KNN,聚类,决策树,随机森林,等传统机器学习方法。深度学习 Deep Lea

文章图片
#深度学习#机器学习#人工智能
Flask框架初探-如何在本机发布一个web服务并通过requests访问自己发布的服务-简易入门版

本文主要是面对小白入门一下如何非常简单的使用flask框架发布一个服务,设置基础的端口号允许访问的地址,还有用python代码访问自己发布发服务获取结果。

文章图片
#flask#前端#python
OpenAI 使用云控制台进行线上训练微调模型-详细入门版

在完成了GPT多轮对话流式输出和知识向量库之后,接下来就非常重要的对模型进行微调,相比于我了解到的国内的大模型的微调,一般都需要在Linux服务器上使用shell文件进行微调,而OpenAI对GPT模型开放了线上微调的功能,只需要直接上传你的json文件选择一个与训练模型,就可以一键微调,之后也是在PC端直接应用你微调的模型就好,对于学习了解微调来说,这是一个最快的入门方式。

文章图片
#python
    共 22 条
  • 1
  • 2
  • 3
  • 请选择