logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

bfloat16和float16 的区别和联系以及训练过程中如何选择

bfloat16(Brain Floating Point 16)和float16(半精度浮点数)都是,它们的主要作用是和,特别适用于深度学习中的大规模模型训练。尽管它们都属于 16 位格式,但在等方面存在关键差异。下面我用简单的方式解释它们的区别和联系。🚀。

#人工智能#深度学习#分布式 +1
PEFT 方法的含义和作用

PEFT(Parameter-Efficient Fine-Tuning,参数高效微调)是一种在深度学习中微调预训练模型的方法,旨在减少需要调整的参数数量,从而降低计算和存储成本,同时保持模型性能的提升。该方法特别适用于大规模预训练模型(如 BERT、GPT 等),因为这些模型通常包含数亿甚至数十亿的参数,完全微调的代价非常高。

#深度学习#LoRA#自然语言处理 +1
NF4 是一种更聪明的 4bit 压缩方法,它知道「有些值在神经网络里很常见」,所以就把稀缺的 4bit 编码资源优先给这些常见值更高的精度,稀有值就少给点精度

NF4是一种智能4bit量化方法,不同于传统线性均匀量化,它会根据神经网络参数的实际分布特点进行非线性优化。分析发现模型参数多集中在中间区域[-0.5,0.5],两端值较稀疏。因此NF4将有限的4bit编码(16个值)优先分配给高频区域,在[-0.3,0.3]区间设置更精细的分级(如0.05步长),而对低频的极端值(如±1.0)则分配较粗精度。实验表明,这种分配策略使常见中间值的量化误差显著小于线

#神经网络#人工智能#深度学习
nDCG(Normalized Discounted Cumulative Gain,归一化折损累计增益)

nDCG(Normalized Discounted Cumulative Gain,归一化折损累计增益)是一种用于评估排序质量的指标,常见于信息检索和推荐系统。它考虑了排序列表中每个位置的相关性得分,并对靠前位置给予更高权重,同时通过归一化处理使结果在0到1之间,便于不同排序结果的比较。它的计算步骤应该是先计算DCG,然后找到理想情况下的IDCG,最后用DCG除以IDCG得到nDCG。

如何在神经网络模型中通过低秩矩阵调整权重,并只训练少量参数

这段代码展示了的应用,如何在神经网络模型中通过低秩矩阵调整权重,并只训练少量参数。接下来我会详细解释代码中的关键部分,帮助你理解其工作原理。

文章图片
#神经网络#矩阵#深度学习 +1
react中使用useMemo和useCallback

之前学到的memo是用来优化函数组件的重渲染问题,当传入的属性值都没变化时就不会触发组件的重渲染,否则组件就会重渲染。和类组件中的PureComponent组件是类似。useMemo功能是判断组件中的函数逻辑是否重新执行,用来优化性能。import React, { useState, useMemo } from 'react';// , PureComponent, memo, useS...

docker-compose.yaml文件中的environment配置项 和 .env配置文件中的配置项有什么联系和区别

Docker Compose中的.env文件和environment配置解析 摘要:本文详细解析了Docker Compose中.env文件和environment配置的区别、使用方法及优先级规则。.env文件作为配置变量的来源,存储键值对;environment则将这些变量传入容器。当出现冲突时,docker-compose.yaml中的environment配置优先级更高,而终端export的

#docker#容器#运维
docker部署命令行 — 启动一个 MySQL 数据库服务 并且把它的数据存储挂载到卷(volume)里

摘要:这段 docker-compose.yml 配置启动MySQL数据库服务并使用卷存储数据。关键点:1) 使用Compose v3格式;2) 定义名为db的服务;3) 挂载mysql_data卷到容器内的/var/lib/mysql路径保存数据;4) 即使删除容器,卷中的数据仍保留。配置将MySQL数据存储在独立卷中,确保数据持久化,适合需要保留数据库数据的应用场景。通过卷挂载机制,实现了容器

#docker#容器#运维
Chroma 和 FAISS 向量数据库对比

向量数据库(FAISS / Chroma) → 负责存储和管理向量数据VectorStoreIndex → 负责索引、组织、检索,封装了一层语义搜索逻辑

文章图片
#faiss#数据库
Neo4j 的向量搜索(Neo4jVector)和常见的向量数据库(比如 Milvus、Qdrant)之间的区别与联系

摘要 Neo4j向量存储与Milvus/Qdrant都支持向量检索和语义搜索,但核心定位不同。Neo4j将图数据库与向量搜索结合,适合结构化知识图谱问答;Milvus/Qdrant专注于高性能向量检索,适合大规模文档搜索。Neo4j的优势在于图结构与语义搜索的融合,而Milvus/Qdrant在纯向量相似度检索方面性能更优。选择取决于应用场景:结构化信息查询用Neo4j,纯文本语义匹配用Milvu

#neo4j#数据库#milvus
    共 149 条
  • 1
  • 2
  • 3
  • 15
  • 请选择