logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

企业研发用 AI,如何避免幻觉?药企/新材料企业的实战指南

AI 幻觉(Hallucination),指大语言模型(LLM)生成的内容看似流畅合理,却与事实不符、引用不存在、或逻辑不自洽。幻觉类型典型案例研发场景风险虚构引用AI 声称某论文发表于 Nature 2023,实际并不存在误导文献综述方向捏造数据AI 生成"实验表明转化率87%",实为编造导致错误研发决策虚假事实AI 声称某化学反应的活化能为 35 kJ/mol,文献查无此数据配方设计失效错误推

文章图片
#人工智能#大数据
大数据时代,学术期刊数据集成为AI研究的新矿藏

高质量的学术数据集是人工智能研究不可或缺的资源。维普智图的学术数据集产品,以其高数据质量、全学科覆盖、及时更新和版权保障等特点,成为了AI研究者的优选。随着人工智能技术的不断发展,维普智图将继续为研究者提供更加丰富、高效的数据资源,共同推动人工智能领域的进步。

文章图片
#大数据#人工智能#深度学习 +1
手把手教你把DeepSeek-R1微调成领域专家,AI炼丹必备!

对于微调 DeepSeek-R1 这样的大模型,通常建议使用较低的学习率,如 1e-5 至 5e-5,这样可以在避免破坏预训练知识的同时,让模型在领域数据上进行有效的学习。在训练过程中,要对训练过程进行监控,以防止过拟合的发生。同时,也要下载相应的分词器,分词器的作用是将输入的文本转化为模型能够处理的 tokens,它就像是模型的 “翻译官”,确保模型能够理解输入的文本内容。数据清洗就是去除数据中

文章图片
#人工智能#深度学习
手把手教你把DeepSeek-R1微调成领域专家,AI炼丹必备!

对于微调 DeepSeek-R1 这样的大模型,通常建议使用较低的学习率,如 1e-5 至 5e-5,这样可以在避免破坏预训练知识的同时,让模型在领域数据上进行有效的学习。在训练过程中,要对训练过程进行监控,以防止过拟合的发生。同时,也要下载相应的分词器,分词器的作用是将输入的文本转化为模型能够处理的 tokens,它就像是模型的 “翻译官”,确保模型能够理解输入的文本内容。数据清洗就是去除数据中

文章图片
#人工智能#深度学习
手把手教你把DeepSeek-R1微调成领域专家,AI炼丹必备!

对于微调 DeepSeek-R1 这样的大模型,通常建议使用较低的学习率,如 1e-5 至 5e-5,这样可以在避免破坏预训练知识的同时,让模型在领域数据上进行有效的学习。在训练过程中,要对训练过程进行监控,以防止过拟合的发生。同时,也要下载相应的分词器,分词器的作用是将输入的文本转化为模型能够处理的 tokens,它就像是模型的 “翻译官”,确保模型能够理解输入的文本内容。数据清洗就是去除数据中

文章图片
#人工智能#深度学习
到底了