logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微调阶段中的模型自我提升、通用模型蒸馏和数据扩充

本文探讨了机器学习微调阶段的三种关键技术:模型自我提升、通用模型蒸馏和数据增强。模型自我提升通过单次或迭代方式优化模型性能;通用模型蒸馏利用教师模型指导学生模型,包含多种数据合成方法;数据增强则通过标注和重构提升数据质量。这些方法虽能显著提升模型表现,但仍面临计算资源消耗、过拟合风险和数据多样性不足等挑战。未来需要进一步优化这些技术以应对复杂任务需求。

文章图片
#算法#数据挖掘#人工智能
【Water】数据增强中的数据标注、数据重构和协同标注

本文探讨了人工智能中数据增强的三种关键技术:数据标注(Data Labeling)、数据重构(Data Reformation)和协同标注(Co-Annotation)。数据标注为机器学习提供监督信号,包含分类、回归等类型,但面临高成本与偏差问题;数据重构通过数据转换和特征提取优化数据质量;协同标注则利用多人协作提高标注效率与准确性。这些技术通过增加训练数据多样性提升模型性能,但各自存在实施挑战。

文章图片
#重构#数据挖掘#算法
【论文笔记】《Deep Learning for Time Series Anomaly Detection: A Survey》

摘要 《Deep Learning for Time Series Anomaly Detection: A Survey》综述了2024年时序数据异常检测(TSAD)领域的最新深度学习进展。时序异常检测广泛应用于金融、医疗、工业等领域,深度学习模型显著提升了检测性能。文章提出四类方法分类:基于预测、重构、表示和混合模型,并分析其优缺点。重点探讨了单变量(UTS)和多变量(MTS)时序的异常类型(

文章图片
#深度学习#神经网络#cnn +2
深度解析:基于专家的监管方法(Expert-Based Supervision)在复杂系统中的应用

摘要:基于专家的监管方法(Expert-Based Supervision)通过引入领域专家的知识、规则和经验,对复杂系统进行监督和干预。该方法强调人机协同,在自动化控制、人工智能决策等领域发挥关键作用。其核心机制包括规则注入、专家介入式反馈和监督评价体系三个维度,背后涉及专家系统、置信度阈值等理论支撑。虽然存在对专家经验依赖性强等挑战,但在法律伦理责任、长尾事件处理等方面具有不可替代性,特别是在

#回归#数据挖掘#python
【Wandb】wandb介绍

Wandb(Weights and Biases)是一款用于机器学习的实验追踪工具,可记录超参数、训练指标和模型版本。文章介绍了Wandb的安装配置、基础使用(初始化、日志记录、实验结束)和高级功能(超参数优化、模型版本控制),并提供了图像分类项目的实战示例。同时指出了常见错误(如未初始化或结束实验)和最佳实践(清晰命名、控制日志频率等)。Wandb通过云端服务实现实验可视化与协作,帮助开发者优化

文章图片
#算法#python#开发语言
ASFormer 动作分割模型全解析:原理、结构、代码实战与工程踩坑总结

ASFormer是一种基于Transformer的动作分割模型,通过结合Transformer的长时建模能力和多阶段细化机制,有效解决了动作分割中的关键问题。它能够处理长序列视频帧,捕获复杂的跨时间依赖关系,并通过多阶段refinement减少预测抖动和噪声影响。模型结构包含特征降维、Transformer编码器和多阶段细化模块,显著提升了动作边界检测和帧级预测的准确性。相比传统卷积模型,ASFo

#深度学习#计算机视觉#人工智能 +1
动态嵌入:Transformer 架构下的语义重构与演进

摘要: 动态嵌入通过Transformer的自注意力机制实现词汇语义的上下文动态生成,突破了传统静态嵌入的局限。其核心价值在于消除多义词歧义、建立长程依赖关系,显著提升了信息检索、情感分析等NLP任务的精度。在智能客服、内容审查等场景中,动态嵌入能精准捕捉语境语义,推动机器从"识字"到"识意"的跨越,成为现代深度学习处理复杂语义的基石技术。(149字)

#人工智能#深度学习#重构 +1
预训练阶段中的模型自我提升、通用模型蒸馏和数据增强中的数据重构和非LLM驱动的数据增强

在深度学习和自然语言处理(NLP)领域,。本文将深入探讨这些方法在预训练阶段中的应用、原理及其背后的挑战。

文章图片
#数据挖掘#算法#重构
动作方法中的分割与过度分割方法全解析(含代码实战与踩坑案例)

动作分割与过度分割方法解析 动作分割是视频理解中的关键技术,旨在将视频划分为带标签的动作片段。现实场景中动作边界模糊,过度分割成为必要手段——先精细切分再合并,比漏分割更安全。常用方法包括:基于特征相似度的分割、HMM/Viterbi平滑、无监督聚类(如K-Means)以及端到端模型(如MS-TCN)。工业流程通常结合多阶段处理(特征提取→过度分割→平滑优化),需特别注意特征稳定性(如I3D输入需

文章图片
#算法#python#人工智能 +1
纵向洞察引擎:利用多模态 AI 进行早期儿科风险预测的技术路径探索

摘要: AI在儿科医疗中的应用正从影像辅助转向生命轨迹预测,聚焦儿童动态发育特性。前沿技术包括:1)纵向洞察引擎,通过数字孪生模型监测个体发育偏离率;2)多模态建模,整合生长、教育及基因数据,实现生物-社会复合体分析;3)时序数据处理,利用RNN和Transformer捕捉长期健康依赖关系。伦理挑战突出,需平衡数据隐私、算法偏见与解释权。AI推动儿科转向预防医学,从“病后治疗”转为“病前干预”,在

#人工智能
    共 190 条
  • 1
  • 2
  • 3
  • 19
  • 请选择