
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
不确定性量化(UQ)在减少优化和决策过程中的不确定性方面起着关键作用,应用于解决各种现实世界的科学和工程应用。贝叶斯近似和集成学习技术是文献中使用最广泛的两种UQ方法。在这方面,研究人员提出了不同的UQ方法,并测试了它们在各种应用中的性能,如计算机视觉(如自动驾驶汽车和物体检测)、图像处理(如图像恢复)、医学图像分析(如医学图像分类和分割)、自然语言处理(如文本分类、社交媒体文本和惯犯风险评分)、

一方面,研究人员尝试深化MLLMs对视觉的理解,从粗略的实例级理解过渡到对图像的像素级细粒度理解,从而实现视觉区域定位(Regional Grounding)能力,如GLaMM、PixelLM、NExT-Chat和MiniGPT-v2等。部分研究已经开始研究让MLLMs不仅理解输入视觉信号,还能支持生成输出视觉内容。Vitron作为一个统一的像素级视觉多模态大语言模型,实现了从低层次到高层次的视觉

确定性优化算法和随即优化算法是有明显的分界线的。如果加上分布式集群上的实现方式,就可以分为同步或异步的算法。从梯度下降(GD)后,20世纪50年代,各种一阶算法井喷,其中 SGD 也是这个时候的产物。梯度下降(GD)是柯西(Cauchy )大神的1847年提出的。其基本思想是...
损失函数损失函数被称为 cost function, object function, loss function等,这里不区分几种用法的微小区别。机器学习离不开目标函数,我们分析一下目标函数:其中,前一项是经验风险,后一项是结构风险。前者是为了增加 ML 对已有系统的 fitting,后者是尽量减少 ML 模型的复杂度,以避免 overfitting。整个损失函数称为正则化经验风险最小化...
创新性融合自然语言处理(NLP)的情感分析结果与金融数值数据,基于生成对抗网络(GAN)构建时序预测模型,解决“文本与数值特征有效结合”及“稀疏/低相关金融数据学习”两大核心挑战。ST-GAN在所有预测时间维度(1天、15天、30天)的RMSE与NRMSE均显著低于对比模型,平均NRMSE较现有最优深度学习模型降低32.2%。图5:我们的GAN模型的LSTM生成器网络和CNN鉴别器网络的模型架构。

SuperCLIP通过引入轻量级分类监督机制,在保持CLIP原有优势的基础上显著提升了细粒度视觉-文本对齐能力。该方法仅需在视觉编码器后添加0.077%计算量的线性层,利用文本token构建IDF加权的K-hot监督信号,将分类损失与对比损失结合。实验表明,SuperCLIP在零样本分类、图像检索等任务中性能提升显著(如ImageNet-1K准确率最高提升4%),同时有效缓解了CLIP小批次训练的

计算机顶会排名

DeepBooTS 是针对时间序列预测中概念漂移问题,核心创新包括输入与标签双流分解、逐层残差校正及门控系数自适应,在多元、单变量及大规模数据集上均超越18种SOTA方法,实现 15.8% 的平均性能提升,兼具通用性、解释性及深度扩展性。

可端到端训练的概率推理模型,能在单个前向中推断大量样本,以估计响应变量的潜在分布。

在的大模型训练和推理中,有很多计算是没必要的。比如预测下一个句子很难,但是预测句子结束的标点符号很简单。如果给它们分配同样的计算资源,那么后者明显浪费了。它在输入序列中的特定位置动态分配FLOPs(运算次数或计算资源),优化不同层次的模型深度中的分配。通过限制给定层的自注意力和MLP计算的token数量,迫使神经网络学会主要关注真正重要的信息。MOD 通过动态分配大模型中的计算资源,跳过一些不必要








