logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(论文速读)GPT3:语言模型是一次性学习者

OpenAI发布的GPT-3(1750亿参数)标志着语言模型发展的重大飞跃,其核心创新在于Few-Shot学习能力——仅需少量示例即可执行多样任务,无需微调。论文系统评估了GPT-3在语言建模、翻译、问答等任务的表现,发现其Few-Shot性能在多领域超越传统微调模型,甚至接近人类水平

文章图片
#人工智能#自然语言处理#计算机视觉 +1
(论文速读)FDGLM:面向多场景工业故障诊断的深度数字双动力大视觉语言模型

一种基于深度数字孪生和大视觉语言模型的多场景工业故障诊断框架FDGLM。该框架通过数字孪生技术生成高质量振动样本,采用STFT转换为时频谱图,并结合两阶段LoRA微调策略,实现了跨工况和跨数据集的智能诊断。实验结果表明,FDGLM在单工况下诊断准确率达99.5%,跨工况下89.0%,跨数据集下94.7%,同时具备专业水平的会话诊断能力。该方法仅需微调0.86M参数,显著降低了计算开销,为工业设备健

文章图片
#深度学习#人工智能#计算机视觉 +1
(论文速读)基于微调大语言模型的数控车床故障诊断

一种基于微调大语言模型(LLM)的数控车床(CNC)故障诊断框架。针对传统方法存在的故障数据稀缺、诊断过程不透明等问题,该研究采用分层监督微调(HSFT)算法,通过优化复合损失函数平衡序列生成、分层分类和思维链(CoT)一致性正则化损失。同时引入CoT推理模块,构建包含故障分类、自验证和推理的多阶段诊断流程。实验表明,在Qwen和LLaMA系列模型上,该方法相比基线模型显著提升了诊断准确率(Qwe

文章图片
#人工智能#语言模型
(论文速读)FD-LLM:将振动信号编码为文本表示来将振动信号与大型语言模型进行对齐

一种创新的大型语言模型框架FD-LLM,用于实现可解释的机器故障诊断。该框架通过将振动信号编码为文本表示,成功解决了传统方法在泛化能力、可解释性和信息融合方面的三大痛点。研究采用双管线设计:分类导向管线评估模型诊断能力,频谱语言建模管线实现推理驱动的故障分析。实验表明,Llama3模型表现出色,在CWRU数据集上达到99.8%的准确率,并展现出强大的跨工况适应性和噪声鲁棒性。特别是提出的频谱文本编

文章图片
#人工智能#深度学习#智能制造 +1
(论文速读)TSSA:令牌统计自注意力机制

一种新型线性复杂度注意力机制Token Statistics Transformer (ToST),通过变分率降低理论重构了传统Transformer的自注意力模块。研究表明,ToST在保持竞争力的同时,显著提升了计算效率:在ImageNet-1k上达到80.3%准确率,长序列任务中平均得分59.90优于标准Transformer,语言建模损失4.02优于GPT-2。关键创新在于用token统计量

文章图片
#机器学习#人工智能
(论文速读)基于混合学习的边缘计算物联网系统操作视觉质量检测

一种基于混合学习方法的边缘计算物联网系统,用于工业视觉表面质量检测。该方法结合深度神经网络的无监督聚类,仅需少量标注数据即可实现高精度检测。系统采用VGG网络提取特征,通过改进的k-means聚类进行异常判断,并运用预训练、数据增强等策略提升小数据集下的性能。实验表明,该方法在已知缺陷检测中准确率达97%,对新型未知缺陷的召回率比传统方法高出11%-34%,在实际工厂部署中显著减少了人工质检工作量

文章图片
#人工智能#深度学习#物联网 +1
(论文速读)物联网系统边缘设备上的节能快速目标检测

一种基于帧差法和轻量级AI分类器的节能快速目标检测方法,适用于物联网边缘设备。该方法通过帧差定位运动区域,再使用轻量级模型分类,相比端到端方法在AMD Alveo U50、Jetson Orin Nano和Hailo-8三种边缘设备上实现了平均28.3%的准确率提升、3.6倍的能效提升和39.3%的延迟降低。实验表明MobileNet模型综合表现最优,而YOLOX对快速移动目标(如飞机、火车)检测

文章图片
#目标跟踪#人工智能#计算机视觉
(论文速读)基于大语言模型的类人单次故障诊断

一种基于大语言模型(LLM)的类人单样本故障诊断方法。通过将传感器数据转化为语言表示并引入LLM的推理能力,结合算术编码构建信息距离度量,实现了仅需单样本即可完成准确诊断。实验在冷水机组系统上验证了该方法的有效性,达到了零误差的诊断精度。该方法突破了传统小样本学习需要多个样本的限制,为复杂工业系统的智能故障诊断提供了新思路,同时展示了LLM在工业领域的应用潜力。研究还揭示了模型规模与诊断性能的正相

文章图片
#机器学习#人工智能#目标检测
(论文速读)LogInsight:基于大语言模型的准确可解释日志故障诊断

LogInsight框架,利用大语言模型实现准确且可解释的日志故障诊断。针对现有方法缺乏解释性和大语言模型直接应用的局限性,LogInsight通过三个创新点解决问题:(1)面向故障的日志摘要模块(FOLS)压缩冗余日志;(2)构建专业指令数据集(LFDInstruction)注入领域知识;(3)采用LoRA方法对Mistral-7B模型进行高效微调。实验表明,LogInsight在三个真实数据集

文章图片
#语言模型#人工智能#自然语言处理 +1
(论文速读)基于GAN的一维医学数据增强

基于WGAN-GP的一维医学数据增强方法,解决医学AI面临的数据稀缺和不均衡问题。针对影像组学等一维医学数据,该方法通过改进的生成对抗网络生成高质量合成样本。实验在心脏病和放射性肺炎数据集上验证,相比SMOTE和普通GAN,WGAN-GP显著提升AUC和敏感性指标,尤其在小样本场景优势明显。可视化分析显示生成数据分布更接近真实样本。该研究首次将WGAN-GP应用于一维医学数据增强,为医疗AI数据瓶

文章图片
#人工智能#生成对抗网络
    共 134 条
  • 1
  • 2
  • 3
  • 14
  • 请选择