logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Loss/损失函数05:Triplet Loss(三元组损失)详解【拉近类内距离、拉远类间距离】【应用场景:人脸识别、图像检索、行人重识别、签名验证、语音识别】

相似的图像(如同一个人的不同照片)在特征空间中距离很近不相似的图像(如不同人的照片)在特征空间中距离很远传统的分类损失(如交叉熵)需要预先知道所有类别,但在人脸识别中,我们可能会遇到训练时没见过的新人脸。Triplet Loss通过学习一个嵌入空间(Embedding Space),使得相似样本靠近,不相似样本远离,从而解决这个问题。三元组结构目标DapαDanDapαDan损失函数L∥fa−fp

#人工智能
SlimPajama:CerebrasAI开源最新可商用的高质量大语言模型训练数据集,含6270亿个tokens!

TOGETHER发布的RedPajama数据集包含1.21万亿的tokens。通过过滤重复数据和低质量数据集之后,SlimPajama去除了原始RedPajama的49.6的字节数,将1.21万亿的tokens降低到6270亿的tokens。SlimPajama数据产生的过程如下,首先从RedPajama中去除短的、低质量的文档。在去除标点符号、空白符号、换行符和制表符之后,将短于200个字符的文

文章图片
#语言模型#人工智能#自然语言处理
时间序列预测方法:传统统计方法、机器学习方法、深度学习方法、Transformer、大语言模型方法、多模态方法

【代码】时间序列预测方法:传统统计方法、机器学习方法、深度学习方法、Transformer、大语言模型方法、多模态方法。

#深度学习#机器学习#transformer
旭日X3派:实时语音识别

给大家分享一个基于 新一代 Kaldi 的子项目在 x3 派上进行语音识别的例子. (

文章图片
#语音识别#人工智能
Git08-代码Review01:GitLab 中接入 AI Code Review 完整指南

本文目标是为一个示例项目接入自动化 AI Code Review,效果是:GitLab 官方说明,Merge request pipelines 可以在创建或更新 MR 时运行专门的 CI/CD 任务;CI/CD 任务由仓库根目录的配置。(GitLab 文档)为了避免和你的真实项目混淆,本文统一使用这些示例名称:最终链路是:开发者提交 MR → GitLab MR Pipeline 触发 → Ru

#人工智能#gitlab#代码复审
语义分割(Semantic Segmentation)【截至2025年4月】

(Semantic Segmentation)是计算机视觉中的核心任务,旨在为图像中的每个像素分配一个语义类别标签,实现像素级别的语义理解。

PPO、GRPO、GSPO 完整对比解析

核心发现:GSPO的创新在于将重要性比率从token级提升到序列级,这是一个重大的理论突破。策略优化是强化学习的核心,目标是让AI学会在不同情况下做出最好的决策。想象你在教一个机器人下棋:1.3 核心思想对比PPO:使用token级重要性比率和裁剪机制,需要价值网络估计优势函数GRPO:使用token级重要性比率但采用群组归一化优势,去除价值网络依赖GSPO:使用序列级重要性比率和序列级裁剪,解决

#人工智能
自动驾驶世界模型-范式02-BEV&规划-01:OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving

Wenzhao Zheng1,* Weiliang Chen2,* Yuanhui Huang1 Borui Zhang1 Yueqi Duan2 Jiwen Lu1{ \mathrm { L } } { \mathrm { u } } ^ { 1 }Lu1 Department of Automation, Tsinghua University, China Department of Ele

#自动驾驶#3d#人工智能
世界模型(World Model)【以动作为条件的视频生成模型】

世界模型(World Model)【以动作为条件的视频生成模型】

#人工智能
    共 728 条
  • 1
  • 2
  • 3
  • 73
  • 请选择