logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

简单几步微调Llama 3大模型,小白轻松上手

这是面向小白用户的一个超级简单的微调大模型示例,通过这个例子将得到一个速度翻倍,并可以包含自己业务知识数据的微调后llama3模型,可用于本地部署构建私有化的AI智能体。very 的 nice首先请准备好google账号和网络环境,这个示例基于goolge colab的免费算力完成。使用浏览器打开上方链接将点击copy to Drive复制笔记到自己账号下的网盘,点击之后弹出新窗口我们就在这个弹出

文章图片
#语言模型#人工智能#自然语言处理
一口气了解大模型相关通识,基础笔记!

,特指部分参数的微调方法,这种方法算力功耗比更高,也是目前最为常见的微调方法;除此之外,Fine-Tuning也可以代指全部微调方法,同时OpenAI中模型微调API的名称也是需要注意的是,OpenAI提供的在线微调方法也是一种高效微调方法,并不Fine-Tuning,是全量微调;微调, Fine-Tuning,一般指全参数的微调 (全量微调) ,指是一类较早诞生的微调方法,全参数微调需要消耗大量

文章图片
#人工智能#学习
AI大模型的指令微调

有监督微调(Supervised Finetuning,SFT)又称指令微调(Instruction Tuning),是指在已经训练好的语言模型的基础上,通过使用有标注的特定任务数据进行进一步的微调,使模型具备遵循指令的能力。由于大语言模型的参数量十分庞大,当将其应用到下游任务时,微调全部参数需要相当高的算力。为了节省成本,研究人员提出了多种参数高效(Parameter Efficient)的微调

文章图片
#人工智能#语言模型#自然语言处理 +1
大模型在企业知识库场景的落地思考

今天我们深入探讨了企业在知识库场景下运用大型模型的实践策略。我们首先分析了大型模型在企业实际应用中所面临的挑战,包括算力、调度和数据等方面的问题。随后,我们提出了一系列解决方案,包括构建高效管理和自适应扩展的算力资源体系,开发或引进先进的调度系统,以及建立完善的数据处理流程。最后,我们强调了企业在实施大型模型实践策略时,必须关注数据安全、隐私和合规问题,以确保实践方案的可行性和可持续性。

文章图片
#人工智能#架构#语言模型 +2
人工智能大模型在医疗领域的应用进展与前景

随着人工智能技术的进步和深度学习算法的发展,以及海量多模态数据的爆炸式增长,芯片、网络、算力等基础建设的持续增强,大模型也迎来了快速发展机遇。2014年生成对抗网络 GAN(Generative Adversarial Network)的出现,推动了生成式人工智能的革命性发展,随后以 Transforme、BERT为代表的预训练模型的诞生,颠覆了以往的深度学习模型网络结构,大幅提高了模型训练速度和

文章图片
#人工智能#语言模型#自然语言处理
急!现在转大模型还来得及吗?

大模型的出现,让行内和行外大多数人都感到非常焦虑。行外很多人想了解却感到无从下手,行内很多人苦于没有硬件条件无法尝试。想转大模型方向,相关的招聘虽然层出不穷,但一般都要求有大模型经验。而更多的人,则一直处于观望之中,感觉自己只能每天看看各种自媒体,以及在聊天时的各种口嗨,难以躬身入局。但也有不少人对其表示怀疑,巨大的算力成本和模糊的落地场景是其发展的阻碍。大家更容易将其和元宇宙等概念联系起来,视为

文章图片
#人工智能#学习
从零开始构建AI Agent:手把手带你成为智能体开发者

Datawhale社区推出的"Hello-Agents"项目是一个系统性AI智能体学习教程,旨在帮助读者从零开始构建AI Native Agent。教程结合理论与实战,使用自研HelloAgents框架,深入讲解智能体核心原理、架构和经典范式,让读者从大模型使用者蜕变为智能体系统构建者。项目提供在线阅读和PDF下载,适合有Python基础的开发者学习。

文章图片
#人工智能
LangGraph源码分析 - AI Agent如何智能处理用户输入,从入门到精通

文章详细解析了Open Deep Research项目中用户澄清阶段的实现机制。通过分析clarify_with_user函数,解释了配置检查、模型准备、澄清分析和流程路由四个步骤的工作原理,以及State中messages字段的流转和更新过程。同时介绍了结构化输出模型和提示词设计,帮助读者理解AI Agent如何智能处理用户输入,确保研究方向的准确性。

文章图片
#人工智能#java#开发语言
一文读懂Agent Skills:从概念到实践,让AI助手变身全能工具

Agent Skills是Claude发布的跨平台可移植性开放标准,本质是将个人或团队的SOP变成Agent可长期复用的"技能包"。通过发现、激活、执行三步工作,Skills实现"经验→自动化→复用",比临时性Prompt和连接型MCP更具优势。文章介绍了多个Agent Skills平台资源,并以Cursor为例演示了安装使用方法,帮助读者快速掌握这一热门AI技能。

文章图片
#人工智能#transformer#深度学习
大模型AI Agent开源框架全攻略

这篇文章详细介绍了11个热门的大模型AI Agent开源框架,包括AutoGPT、Dify、LangChain等。这些框架涵盖了自主目标拆解、多智能体协作、低代码开发等多种应用场景。每个项目都有独特特点和适用场景,适合不同层次开发者。无论是初学者还是专业开发者,都能从中找到合适的AI Agent开发工具,快速上手大模型应用开发。

#人工智能#开源#java +1
    共 583 条
  • 1
  • 2
  • 3
  • 59
  • 请选择