logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

预训练任务全解析:从掩码语言建模到多模态学习

预训练任务的设计是AI模型获取通用能力的关键。从NLP的MLM到CV的MIM,从单模态到多模态,任务设计日益精巧高效。这些任务不仅推动了技术进步,也深化了我们对智能本质的理解。随着任务设计的不断创新,AI模型将具备更全面、更深刻的世界理解能力,向通用人工智能的目标稳步迈进。

#学习
马尔可夫链蒙特卡洛(MCMC)——用随机探索破解复杂概率分布

MCMC方法之美在于它将两个看似简单的概念——蒙特卡洛随机抽样和马尔可夫链——结合成一个强大的工具,解决了贝叶斯推断中的核心计算难题。正如我们的探险家通过随机游走最终能找到宝藏分布一样,MCMC让我们能够在高维、复杂的概率空间中进行有效探索。从Metropolis-Hastings的接受-拒绝机制到Gibbs采样的条件更新策略,这些算法为我们提供了在不同场景下应对挑战的工具。虽然MCMC不是万能的

文章图片
#机器学习#人工智能#神经网络
随机变量及其分布:深入理解概率模型的基础

随机变量及其分布构成了概率论与统计学的核心框架,为我们描述和分析不确定性提供了统一的数学语言。从简单的伯努利试验到复杂的联合分布,从离散计数到连续测量,这一理论体系不断发展完善,成为现代数据科学和机器学习的基石。

文章图片
#概率论
论文解读:Denoising Diffusion Probabilistic Models(DDPM,去噪扩散概率模型)

在深度学习领域,生成模型一直被视为皇冠上的明珠。从早期的变分自编码器(VAE)和生成对抗网络(GAN),到强大的自回归模型(如PixelCNN),研究者们一直在探索如何让机器学会“创造”。2020年,Google Research的Jonathan Ho等人在论文《Denoising Diffusion Probabilistic Models》中提出了一种新的生成模型——去噪扩散概率模型,它不仅

文章图片
#生成对抗网络#机器学习#深度学习 +2
我们如何教AI听懂一首歌的“好”?——ICASSP 2026音乐美学评估竞赛方案解读

评估全长歌曲的美学质量具有挑战性,因为诸如连贯性、乐句和结构等感知属性无法被信号级指标很好地捕捉。我们为ICASSP 2026 SongEval挑战赛[1]提出了一个统一的多流音乐Transformer。该模型集成了来自多个预训练系统的语义、结构、节奏和人声表征,通过一个轻量级拼接编码器进行融合,并利用一个控制条件Transformer进行维度特定的精炼。在官方测试集上的实验显示出与人类评分的高度

文章图片
#人工智能
从信号到文字:语音识别(ASR)技术链路解析

梅尔滤波器组特征(FBank)- 现代深度学习ASR的主流输入FBankkmln⁡∑i∣Xim∣2⋅HkiϵFBankkmlni∑​∣Xim∣2⋅Hk​iϵ其中HkiH_k(i)Hk​i为第kkk个梅尔滤波器在频点iii的权重。梅尔频率倒谱系数(MFCC)- 传统GMM-HMM ASR的标准特征Cn∑k1Klog⁡Mk⋅cos⁡nk−12πKn01N−1C。

文章图片
#语音识别#人工智能
深度学习基本模块:MultiheadAttention 多头注意力机制

多头注意力机制(MultiheadAttention)是Transformer的核心组件,通过并行计算多个注意力头,使模型能同时捕捉输入序列中不同表示子空间的信息。该机制将输入特征分割到多个子空间独立计算注意力,再合并结果,显著增强了序列建模能力。其可学习参数包括投影权重和偏置项,支持灵活配置嵌入维度和注意力头数。输入输出采用(batch, seq, feature)格式,可应用于自注意力、交叉注

文章图片
#深度学习#人工智能
深度学习基本模块:LSTM 长短期记忆网络

input_color = ‘#FFD700’# 金色hidden_color = ‘#1E90FF’ # 道奇蓝cell_color = ‘#32CD32’# 酸橙绿gate_color = ‘#FF4500’# 橙红色arrow_color = ‘#8B0000’# 深红色definitsuper().init()

文章图片
#深度学习#lstm#人工智能
深度学习基本模块:Conv1D 一维卷积层

Conv1D 是一种专门用于处理一维数据的卷积层。它通过滑动卷积核(滤波器)在输入序列上进行卷积操作,从而提取局部特征。与二维卷积(Conv2D)不同,Conv1D 只在一个维度上进行卷积,适合处理时间序列数据、音频信号和文本数据。

文章图片
#深度学习#人工智能
深度学习:归一化技术

在深度学习中,归一化技术是提高模型训练效率和性能的重要手段。归一化通过调整输入数据的分布,使得模型在训练过程中更易于收敛,减少过拟合的风险。本文将介绍几种常见的归一化技术,包括特征归一化、批归一化、层归一化和实例归一化。

文章图片
#深度学习#人工智能
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择