
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近在做神经网络相关的实验,为了方便神经网络参数是否变化,学习一下TensorBoard可视化网络的参数的方法,这里使用pytorch实现。

LoRA是一种参数高效的微调技术,其原理可以参考Lora原理与实战这里我们着重讲一下QLoraQLora在LoRA:j结合了分位数量化和分块量化的4位标准浮点数量化双重量化:通过量化量化常量来节省内存。分⻚优化器:使用CPU内存代替GPU显存保存部分梯度参数因此我们通过peft框架实现QLora,只要开启上面三个机制就可以在⼤模型训练过程中,量化是⼀种降低模型计算复杂度和存储需求的技术。

大模型幻觉问题(AI Hallucination),指的是大型语言模型在生成文本时,产生事实不准确、逻辑不一致或完全虚构的内容,尽管这些内容看似合理且有说服力,但实际上并不反映真实世界的知识或数据。这种现象通常发生在模型没有足够的背景信息、推理能力不足、或者从训练数据中学习到的知识不完全时。尽管大模型在生成自然语言方面表现出了出色的能力,但它们并不具备真正的理解能力,因此可能会“幻觉”出不存在的事

在深度学习中,数据量通常是都非常多,非常大的,如此大量的数据,不可能一次性的在模型中进行向前的计算和反向传播,经常我们会对整个数据进行随机的打乱顺序,把数据处理成一个个的batch,同时还会对数据进行预处理。所以,接下来我们来学习pytorch中的数据加载的方法。

使用时,发现项目运行不了,经过排查之后,发现是python版本的问题,之前的项目在本地测试是python版本是3.7,但是的python版本是3.10,所以需要修改python版本,下面记录一下过程。

文章预览思路一、示例1.1、MainActivity.java1.2、activity_main.xml1.3、创建Fragement二、测试思路使用Bundle来进行通信Bundle类用作携带数据,它类似于Map,用于存放key-value名值对形式的值。相对于Map,它提供了各种常用类型的putXxx()/getXxx()方法,如:putString(/getString()和putInt()
大模型幻觉问题(AI Hallucination),指的是大型语言模型在生成文本时,产生事实不准确、逻辑不一致或完全虚构的内容,尽管这些内容看似合理且有说服力,但实际上并不反映真实世界的知识或数据。这种现象通常发生在模型没有足够的背景信息、推理能力不足、或者从训练数据中学习到的知识不完全时。尽管大模型在生成自然语言方面表现出了出色的能力,但它们并不具备真正的理解能力,因此可能会“幻觉”出不存在的事

本文主要介绍Xinference框架的使用方式,使用的环境是ubantu官方教程。
DQN算法DQN算法有一个显著的问题,就是DQN估计的Q值往往会偏大。这是由于我们Q值是以下一个s’的Q值的最大值来估算的,但下一个state的Q值也是一个估算值,也依赖它的下一个state的Q值…,这就导致了Q值往往会有偏大的的情况出现。所以出现了对DQN算法的改进算法算法。

往往我们拿到网上开源的代码,最令人头疼的就是配置环境,常常是代码还没有开始看,配环境配了一整天,其次是有时候我们需要多台服务器运行代码,环境需要配置多遍,熟悉配置环境的流程还好,不熟悉又是花时间的活,因此我们需要一种快捷的方式将已经配置好的环境直接迁移过来用。下面我将用两种方式实现。== 注意:本操作的前提是你已经安装了conda环境==
