logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

windows系统docker装milvus向量数据库

注意如出现错误说明端口被占用,需要改docker-compose。首先创建一个文件夹比如milvus,在创建如下文件。# 运行docker。

文章图片
#docker#milvus#容器
最简单的deepspeed微调

DeepSpeed是一个开源的深度学习优化库,它由微软开发并维护,旨在提高大规模模型训练的效率和可扩展性。# 移动finetune_lora_single_gpu.sh到外面。训练优化工具:融合优化器,自动混合精度训练,学习率调度。通信优化模块:张量并行,数据并行,流水线并行。1.啥是deepspeed?# 准备数据(例如)

文章图片
#人工智能#深度学习
AttributeError: ‘AdamW‘ object has no attribute ‘train‘

pip install accelerate==0.34.0并更新最新LLaMA Factory。

最简单的线性回归神经网络

【代码】最简单的线性回归神经网络。

文章图片
#线性回归#神经网络#算法
大模型qwen-turbo流式输出+多轮对话+前端SSE

2.将用户问的问题添加messages中。1.创建一个模型类与序列化器。3.前端SSE接收流式输出。

#前端#django#后端 +3
常见激活函数

Sigmoid函数:能够将输入压缩到[0, 1]的范围内,通常用于二分类任务的输出层。Tanh函数:与Sigmoid类似,但是它能将输入压缩到[-1, 1]的范围内,通常具有比Sigmoid更好的性能。ReLU函数:修正线性单元,是目前最常用的激活函数之一,特别是在隐藏层中。它的优点是能够缓解梯度消失问题,并且计算简单。Leaky ReLU / Parametric ReLU / Exponent

文章图片
#深度学习#机器学习#人工智能
    共 22 条
  • 1
  • 2
  • 3
  • 请选择