logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DINOv3权重文件下载

DINOv3权重文件下载指南 DINOv3是Meta推出的高性能视觉基础模型,包含12种变体(10个基于LVD-1689M数据集,2个基于SAT-493M卫星数据集)。模型采用ViT架构,支持16的补丁尺寸,可处理224x224或更大尺寸的输入图像。目前权重下载可通过两种方式: HuggingFace(当前需权限申请) GitHub仓库(填写申请表单后获取下载链接,建议使用美国IP和Gmail邮箱

文章图片
#人工智能#github
【时间序列预测】From Similarity to Superiority: Channel Clustering for Time Series Forecasting

时间序列预测中,通道独立(CI)策略通过单独处理不同通道提升性能,但泛化能力差且忽视通道交互;通道依赖(CD)策略将所有通道混合,但导致过平滑问题。针对此,我们开发了基于内在相似性的通道聚类模块(CCM),动态分组通道并结合分组信息,兼顾CI和CD的优点。实验表明,CCM可显著提升长期和短期预测性能(CI模型平均提升2.4%,CD模型平均提升7.2%),实现零点预测,并有效挖掘时间序列的内在相似性

文章图片
#时序数据库#聚类#数据挖掘 +2
基于神经网络的情景喜剧笑点识别(CCL2020-EHC)

本文主要内容为关于EHC幽默识别的分类任务,主要是针对数据集进行处理,通过预训练模型进行训练,而没有详细的讲怎么去构建神经网络模型,以及神经网络的实现过程是什么样的,当然这也是本文的不足吧。但是通过我给出的预训练模型,可以非常简单的完成本次幽默识别的任务,效果也还算不错吧。............

文章图片
#nlp#深度学习#bert +2
时间序列UCR和UEA数据集介绍

​UCR单变量时间序列数据集(包含128个数据集,如传感器数据、图像数据等)、UEA多变量时间序列数据(包含30个数据集,如面部检测、轨迹数据等),目前是时间序列挖掘领域重要的开源数据集资源。详细的数据集介绍可以阅读这两篇论文The UCR Time Series Archive和The UEA multivariate time series classi cation archive, 201

文章图片
#python#数据结构
中文幽默计算ECHC

目录前言一、任务介绍二、数据集三、数据处理3.1数据合并3.2数据扩展3.3数据集划分四、预训练模型五、结果5.1引入库5.2加载模型 5.3获得result文件 5.4运行结果 5.5评测结果 总结这是一个评测网站上的任务,评测地址为:http://sa-nsfc.com/evaluation/http://sa-nsfc.com/evaluation/这里面有6个nlp评测的任务,如图: 所以

文章图片
#大数据#nlp#bert +2
【时间序列预测】From Similarity to Superiority: Channel Clustering for Time Series Forecasting

时间序列预测中,通道独立(CI)策略通过单独处理不同通道提升性能,但泛化能力差且忽视通道交互;通道依赖(CD)策略将所有通道混合,但导致过平滑问题。针对此,我们开发了基于内在相似性的通道聚类模块(CCM),动态分组通道并结合分组信息,兼顾CI和CD的优点。实验表明,CCM可显著提升长期和短期预测性能(CI模型平均提升2.4%,CD模型平均提升7.2%),实现零点预测,并有效挖掘时间序列的内在相似性

文章图片
#时序数据库#聚类#数据挖掘 +2
【时间序列聚类】Temporal Phenotyping using Deep Predictive Clustering of Disease Progression

由于医疗电子健康记录的普及,患者的护理数据通常以时间序列形式存储。对这类时间序列数据进行聚类分析在患者分型、预测预后及制定同质亚群治疗策略中具有重要意义。本文提出了一种基于深度学习的时间序列聚类方法,旨在将患者分成不同群组,每个群组的成员具有相似的未来结果(如不良事件或并发症的发生)。通过学习离散表示并引入新的损失函数,该方法鼓励聚类内具有同质化的未来结果分布。实验在真实世界数据集上验证了模型的优

文章图片
#聚类#数据挖掘#机器学习
【时间序列聚类】Time-Series Clustering Based on the Characterization of Segment Typologies(基于分段类型特征的时间序列聚类)

时间序列聚类旨在根据相似性或特征对时间序列进行分组。传统方法结合特定距离测量和标准聚类技术,但未充分考虑不同子序列的相似性。本文提出一种两阶段时间序列聚类技术。第一阶段通过最小二乘多项式分割程序生成片段,并基于近似线段模型系数和统计特征将片段投影到一维空间。随后,进行第一次分层聚类以提取片段组。第二阶段定义特定映射过程,在同一维空间中表示所有时间序列并最终分组。算法自动调整主要参数,即误差阈值,考

文章图片
#聚类#支持向量机#算法 +1
【多视图聚类】Deep Multiview Clustering by Contrasting Cluster Assignments(通过对比聚类分配进行深度多视图聚类)

多视图聚类(MVC)旨在揭示多视图数据的潜在结构,但现有深度学习方法在探索多视图不变表示方面仍具挑战性。本文提出了一种跨视图对比学习(CVCL)方法,通过对比分析多个视图间的聚类分配来学习不变表征并生成聚类结果。该方法采用深度自动编码器提取与视图相关的特征,并在微调阶段引入聚类级别的CVCL策略以探索多视图间的一致语义信息。实验表明,所提出的CVCL方法通过软聚类赋值对齐策略显著提高了聚类区分度,

文章图片
#聚类#数据挖掘#机器学习
【时间序列聚类】Brain EEG Time-Series Clustering Using Maximum-Weight Clique(利用最大权重团对脑电图时间序列进行聚类)

脑电图(EEG)是一种复杂、微弱且高度变化的时间序列数据,在神经认知障碍诊断和脑机接口中应用广泛,但传统无监督方法难以有效处理其无标记特性。本文提出了一种新颖的聚类算法mwcEEGc,通过改进弗雷切相似性加权并构建最大加权簇(MWC)来解决无标记EEG时间序列的聚类问题。该算法避免计算聚类中心点,直接根据顶点和边权重进行聚类。实验表明,mwcEEGc在14个真实脑电图数据集上优于10种先进方法,并

文章图片
#聚类#支持向量机#算法 +1
    共 14 条
  • 1
  • 2
  • 请选择