logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型学习--微调

模型微调是一种在已有预训练模型的基础上,通过使用特定任务的数据集进行进一步训练的技术。这种方法允许模型在保持其在大规模数据集上学到的通用知识的同时,适应特定任务的细微差别。

文章图片
大模型学习路线以及资料--更新中

总结了一下大模型学习路线和基本学习资料,后续会不断更新。从零开始学习吧,不然的话很可能被这个时代抛弃。

文章图片
#学习
大语言模型学习--本地部署DeepSeek

本地部署一个DeepSeek大语言模型 研究学习一下。本地快速部署大模型的一个工具 先根据操作系统版本下载Ollama客户端ollama是一个开源的大型语言模型(LLM)本地化部署与管理工具,旨在简化在本地计算机上运行和管理大语言模型的流程。它支持多种主流开源模型(如Llama、Mistral、DeepSeek、Qwen等),并通过命令行工具、API接口及丰富的社区生态,为开发者、研究人员和爱好者

文章图片
机器学习--降维技术PCA

1.PCA降维原理:PCA属于线性降维方式:X为原空间  W为变化矩阵  Z为新空间    Z的维数要小于X维数,实现了降维处理。用一个超平面来表示正交属性空间的样本点,这个超平面应该尽量满足最近重构性以及最大可分性,即空间中所有点离这个超平面尽可能近,样本点在超平面的投影尽可能区分开,基于最近重构性以及最大可分性,可以推导出PCA分析就是对于矩阵XXT进行特征值分解:对于...

大语言模型学习--LangChain

LangChain作为一个脚手架 能够快速集成大模型以及实现一些其他格式化功能,本质是为了能够更好的调用相关大模型API以及进行业务逻辑处理。首先要申请API-key 然后本地python调用一下。下面使用Langchain来集成阿里的通义千问。API-Key申请参考链接。LangChain官网地址。LangChain具体能力。langchain依赖关系。

文章图片
#语言模型#学习
大语言模型学习--LangChain

LangChain作为一个脚手架 能够快速集成大模型以及实现一些其他格式化功能,本质是为了能够更好的调用相关大模型API以及进行业务逻辑处理。首先要申请API-key 然后本地python调用一下。下面使用Langchain来集成阿里的通义千问。API-Key申请参考链接。LangChain官网地址。LangChain具体能力。langchain依赖关系。

文章图片
#语言模型#学习
深度学习--卷积神经网络CNN--手写字体MNIST识别

使用CNN来实现MNIST数据集手写字体识别。MNIST数据集分为训练集以及测试集,其中每张图片都是28*28*1类型的黑白数字图片,每张图片有标签信息是一个10维数组向量,其中某一位为1,其余为0,用来表示该图片数字属于0-9中哪一个。之前用逻辑回归实现手写字体识别,这里使用CNN来实现手写字体识别,使用tensorflow。网络设计CNN网络总体设计如下:输入图片读取图...

机器学习--蓄水池抽样与加权抽样算法

学习一下蓄水池抽样以及加权抽样算法1.蓄水池抽样如果数据总量是有限的,随机抽样k个值,可以直接利用随机数产生器来产生。如果数量总量是不断增加的,内存并不能完全存放所有数据,此时若随机产生k个值可以采用蓄水池抽样算法。1.从一个数据流中随机取出一个数,要求每个数被取到的概率相等第一个数以概率1取值,第二个数以1/2概率替换,第三个数以1/3概率替换。。。。直到第n个数第一个数被取...

时间序列分析----灰度模型

灰度预测法是一种对含有不确定因素的系统的预测方法,灰色系统是位于白色系统和黑色系统之间的一种系统。白色系统指的是一个系统内部的特征是完全已知的,使用者不仅知道系统的输入-输出关系,还知道实现输入-输出的具体方式,譬如函数表达式,微分方程的变化公式,或者物理学的基本定律。比方说牛顿第二定律F=ma, 使用者只需要知道物体的质量和加速度,就可以通过牛顿第二定律求出所使用的力F的具体值。或者说当物体的.

大模型学习路线以及资料--更新中

总结了一下大模型学习路线和基本学习资料,后续会不断更新。从零开始学习吧,不然的话很可能被这个时代抛弃。

文章图片
#学习
    共 28 条
  • 1
  • 2
  • 3
  • 请选择