logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

优化器的发展:从梯度下降➔大模型优化器【SGD➔AdaGrad➔RMSProp➔Adam(自适应)➔AdamW➔LAMB➔AdaFactor➔Shampoo➔Lion】

从最基础的梯度下降到复杂的大模型优化器,我们走过了机器学习优化算法的发展历程。**梯度下降(SGD)**奠定了基石,但存在学习率和收敛稳定性难题。Momentum动量法赋予优化以惯性,大大改善了在狭窄峡谷区域的震荡问题和收敛速度。Nesterov加速梯度则让动量更聪明,增加了预判能力,从而进一步提升了优化效率和稳健性。AdaGrad开创了自适应学习率,通过累积梯度历史自动调整步长,对稀疏数据效果突

#人工智能
目标检测-评测指标:mAP、FPS、IoU

mAP(mean Average Precision)是用来衡量目标检测模型在多个类别上的整体表现的指标,主要关注模型的准确性(Precision)和全面性(Recall)。FPS(Frames Per Second)是衡量目标检测模型处理图像速度的指标,主要关注模型的实时性。希望这个解释对你理解目标检测的评测指标有所帮助!

#目标检测#目标跟踪#人工智能
NLP-预训练模型-202302-NLU:BGE (BAAI General Embedding) 【包含Embedder、Reranker】【专注RAG】【隶属FlagEmbedding】【智源】

在训练中为检索任务的查询添加了instruction。对于中文,指令是为这个句子生成表示以用于检索相关文章:. 在评测中,针对段落检索任务的任务需要在查询中添加指令,但不需要为段落文档添加指令。缺乏全面的评测基准,智源团队特意发布了C-MTEB,这是一个全面的中文语义向量评测基准,涵盖了6大类评测任务和31个数据集。智源 发布了其开源的中英文语义向量(embedding)模型BGE,此模型在多个重

文章图片
强化学习微调LLM/VLM中的灾难性遗忘问题:深度技术分析

在使用强化学习(特别是RLHF - Reinforcement Learning from Human Feedback)对大语言模型(LLM)和视觉语言模型(VLM)进行微调时,灾难性遗忘(Catastrophic Forgetting)确实是一个普遍存在且需要重点关注的问题。灾难性遗忘是指模型在学习新任务或适应新分布时,显著丧失其在原有任务上的性能表现。知识退化:模型在通用基准测试上的表现下降

#人工智能#深度学习#计算机视觉
RedPajama-Data-v2: 30万亿token预训练数据开放发布了

目前,最具实力的基础模型都是通过商业 API 封闭的,这限制了研究、定制和对敏感数据的使用。如果开放社区可以弥合开放和封闭模型之间的质量差距,完全开源模型将有望消除这些限制。最近,在这方面取得了很多进展。在许多方面,人工智能正在经历其 Linux 时刻[1]。Stable Diffusion[2] 表明,开源不仅可以与 DALL-E[3] 等商业产品媲美,而且还可以通过全球社区的广泛参与带来令人难

文章图片
#语言模型
Qwen2.5-Omni-详解03:Pretraining

32k**,显著增强复杂长序列的跨模态理解与推理能力。上述细节(初始化、数据构成、token规模、长度策略与“自然语言提示”设计)均在论文预训练部分明确给出。

#人工智能#深度学习
基于深度学习及LLM/VLM的深度估计技术发展调研报告【2025年8月】

深度估计技术在过去十年中经历了从传统方法到深度学习,再到大模型时代的重要转变。开创阶段(2014-2017):CNN的引入开启了深度学习深度估计的新时代发展阶段(2018-2020):注意力机制和自监督学习的兴起变革阶段(2020-2022):Transformer架构带来的性能突破成熟阶段(2022-2024):基础模型展现出强大的泛化能力融合阶段(2023-2025):多模态大模型的深度理解能

#深度学习#人工智能
OmniQuant-目前最优的LLM PTQ量化算法

LLMs已经彻底改变了自然语言处理任务。然而,它们的实际部署受到其巨大的内存和计算需求的阻碍。尽管最近的后训练量化(PTQ)方法在减少LLM的内存占用和提高计算效率方面取得了有效成果,但它们手工制作的量化参数导致了性能低下,并且无法处理极低比特量化。为了解决这个问题,我们引入了一种全方位校准量化(OmniQuant)技术。它在保持PTQ的计算效率的同时,在多样化的量化设置中取得了良好的性能,通过有

文章图片
#算法
VGGT vs Pi3: 架构对比与排列等变性实现分析

VGGT (Visual Geometry Grounded Transformer)论文来源: Meta AI & University of Oxford (2025)GitHub: https://github.com/facebookresearch/vggt输入图像 (1~数百张)问题1: 破坏完全等变性问题2: 第一帧质量依赖问题3: 多序列融合困难Pi3的解决方案:所有帧平等优势1:

#人工智能
OpenCV-图像处理-几何变换:图像缩放、图像平移、图像旋转、仿射变换、透射变换

缩放:改变图像大小,矩阵对角线元素控制缩放比例平移:移动图像位置,矩阵第三列控制平移量旋转:围绕中心点旋转,三角函数构成旋转矩阵仿射变换:线性变换的组合,保持直线和平行性透视变换:非线性变换,模拟三维投影效果掌握这些变换的数学原理,有助于理解和应用各种计算机视觉算法。在实际编程中,OpenCV等库已经封装了这些变换函数,但理解其数学本质对于参数调优和算法改进非常重要。本教程适合高中及以上数学基础的

#opencv#图像处理#人工智能
    共 588 条
  • 1
  • 2
  • 3
  • 59
  • 请选择