logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文阅读】Improved Denoising Diffusion Probabilistic Models

去噪扩散概率模型 (DDPM) 是一类生成模型,最近已被证明可以产生出色的样本。实验表明,通过一些简单的修改,DDPM还可以在保持高样品质量的同时实现竞争性的对数似然。为了更紧密地优化变分下界 (VLB),我们使用简单的重新参数化和混合学习目标来学习逆向过程方差,该目标将 VLB 与 Ho 等人[1]的简化目标相结合,允许采样前向传递减少一个数量级,样本质量差异可以忽略不计,这对于这些模型的实际部

文章图片
#论文阅读#计算机视觉#人工智能 +1
【论文阅读】(StemGNN)多元时间序列预测的谱时间图神经网络

论文提出了一种新型的深度学习模型StemGNN,用于提高多变量时间序列预测的准确性。论文将多变量时间序列预测问题定义为基于多变量时间图(multivariate temporal graph)的数据结构。StemGNN在频谱域中同时捕获时间序列内部和序列间的相关性。模型结合了图傅里叶变换(GFT)和离散傅里叶变换(DFT),并在端到端框架中使用卷积和序列学习模块进行有效预测。实验在十个真实世界的数

文章图片
#论文阅读#神经网络#人工智能
【论文阅读】SpectFormer: Frequency and Attention is what you need in a Vision Transformer

论文假设频谱注意力和多头注意力都起着重要作用。因此,提出了一种新颖的Spectformer的Transformer架构,该架构结合了频谱和多头注意力层。与 GFNet-H 和 LiT 相比,它使 ImageNet 上的 top-1 准确率提高了 2%。

文章图片
#论文阅读#transformer#深度学习 +3
【论文阅读】Sora: A Review on Background,Technology,Limitations,and Opportunities of Large Vision Models

Transformer模型已被证明可扩展且适用于许多自然语言任务。与GPT-4等强大的大型语言模型(LLM)类似,Sora可以解析文本并理解复杂的用户指令。为了使视频生成在计算上高效,Sora使用。具体而言,Sora将原始输入视频压缩为。然后,,以在短时间间隔内封装视觉外观和运动动态。这些patches补丁类似于语言模型中的单词标记,为Sora提供了用于构建视频的详细视觉短语。Sora的文本到视频

文章图片
#论文阅读#深度学习#人工智能
李宏毅机器学习特训营-PM2.5预测

PM2.5预测课程链接:李宏毅课程-机器学习文章目录PM2.5预测数据集介绍1.数据分析1.1观察数据1.1特征抽取1.1数据分析1.1归一化2.训练3.测试4.预测5.保存数据集介绍本次作业使用丰原站的观测记录,分成 train set 跟 test set,train set 是丰原站每个月的前 20 天所有资料。test set 则是从丰原站剩下的资料中取样出来。train.csv: 每个月

#python#机器学习
到底了