logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型:微调和提示工程

例如,要构建一个法律领域的专业模型,可以先利用提示工程技巧(如角色设定、复杂提问)让一个通用大模型生成大量高质量的“法律问答对”,这些生成出来的数据就可以作为微调所需的训练数据集。无监督学习(如自回归生成、掩码语言建模),掌握词汇的含义、句子的构造规则以及文本的基本信息和上下文,产出。经过指令微调的模型(比如ChatGPT),其遵循指令的能力会得到根本性的提升。:两种技术的最终目标都是引导和激发大

#深度学习#机器学习#人工智能
大模型:微调和提示工程

例如,要构建一个法律领域的专业模型,可以先利用提示工程技巧(如角色设定、复杂提问)让一个通用大模型生成大量高质量的“法律问答对”,这些生成出来的数据就可以作为微调所需的训练数据集。无监督学习(如自回归生成、掩码语言建模),掌握词汇的含义、句子的构造规则以及文本的基本信息和上下文,产出。经过指令微调的模型(比如ChatGPT),其遵循指令的能力会得到根本性的提升。:两种技术的最终目标都是引导和激发大

#深度学习#机器学习#人工智能
【论文阅读08】-大语言模型微调在复杂系统故障诊断中的实证研究

​:本研究证明了微调预训练LLMs进行故障诊断是一种可行且富有前景的新范式。它能够融合语义理解,并展现出小样本学习、强鲁棒性等独特优势。

#语言模型#人工智能#自然语言处理
【论文阅读15】-DiagLLM:基于大型语言模型的多模态推理,用于可解释的轴承故障诊断

准确可靠的轴承故障诊断对于确保机械设备的安全运行至关重要。以往的数据驱动方法在训练先进的深度学习模型时面临挑战,这主要是由于故障数据的稀缺以及数据分布的不一致性。此外,这些方法通常受到有限的可解释性和可靠性的影响,因为它们缺乏基于轴承失效潜在物理机制的约束引导学习,这阻碍了它们在机器状态监测中的应用。大型语言模型(LLM)的最新进展表明,它们有潜力应对这些挑战。为此,我们的目标是利用多模态LLM的

#语言模型#人工智能#自然语言处理
【论文阅读18】-BearingFM:基于领域知识和对比学习的轴承故障诊断基础模型

题目:BearingFM: Towards a foundation model for bearing fault diagnosis by domain knowledge and contrastive learning期刊:International Journal of Production Economics检索情况:作者:单位:发表年份:DOI:设备预测性维护对保障精密制造(如半导体

#学习
【论文阅读17】-结合大模型与小模型的类脑认知驱动模型工厂在工业物联网故障诊断中的应用

用户向LLM提出问题后,LLM采用类脑思维链提示工程方法进行初步诊断首先提取出问题的关键词;然后LLM在知识库中根据关键词进行检索,找到相关知识,并生成提示;LLM根据提示完成初步诊断;初步诊断后,通过生成式纵向联邦学习进行精确诊断首先根据初步诊断的结果,通过动态节点激活机制,选择适合的节点激活,然后超网络根据激活的节点信息和初步诊断生成解决这次问题的专属小模型,由小模型得出精确的诊断结果,最后再

#语言模型#人工智能#自然语言处理
【论文阅读11】-基于大型语言模型的轴承故障诊断框架

作者:Laifa Tao a,b,c,d, Haifei Liu b,c,d, Guoao Ning b,c,d, Wenyan Cao b,c,d, Bohao Huangb,c,d, Chen Lu。这不是简单的数值输入,而是将特征构建成LLM能理解的“指令-回答”对。如下图所示,通过自然语言描述将数值“包装”起来,形成一段富含语义的文本输入,相当于为LLM准备了一份结构清晰的“故障诊断手册”

#汽车
【论文阅读09】-基于多准则决策和综合威布尔分布的汽车制造设备预防性维护建模方法

题目:Method for Modeling Automotive Manufacturing Equipment Preventive Maintenance Derived by MultiCriteria Decision and Synthesized Weibull Distribution期刊:SAE MOBILUS检索情况:作者:Zexin Ma单位:SDU发表年份:2024。

#汽车#制造
【论文阅读07】-大语言模型在复杂设备故障诊断的应用

大模型故障诊断微调:冻结数据编码器和LLM主干网络,仅使用LoRA等技术微调少量参数,使LLM学会根据对齐后的数据嵌入进行故障诊断推理。数据-文本模态对齐​: 训练一个数据编码器,使其能够将工程数据编码成与LLM文本特征空间对齐的嵌入向量,让LLM能“读懂”传感器信号。​: 由两个网络组成,一个“伪造者”网络生成假数据,一个“鉴别者”网络鉴别真伪,两者相互博弈,最终使“伪造者”能生成非常逼真的数据

#语言模型#人工智能#自然语言处理
到底了